1:使用Microsoft.Office.Interop.Word组件 这是比较常用的一种方式,代码就不贴出了,网上大把的例子 缺点:服务器需要装Word的组件,并且需要在服务器上设置Docm+对象的权限,如果一台服务器还好,如果项目应用到多台不同服务器,就比较繁琐了 2: OpenXml API 可以将.docx(word 97-2003 不适用)转化为XML,有了XML,想转成HTML或是其他格式都不再是问题了,此Api需要 .net FreamWork3.5+ Office2007+ 3:第三方:例如Aspose.Words(已测试,推荐) Aspose提供了各种格式的转换方案,有兴趣的可以进去仔细看一下,.NET Java方向的都有,采用其中Aspose.Words这个Dll,无需安装微软Office组件 即可转换Word(Converting DOC,DOCX to HTML without MS Office Word in .Net)
复制代码 代码如下:
Aspose.Words.Document d = new Aspose.Words.Document(wordPhysicalPath); d.Save("d:\\1.html", SaveFormat.Html);