这几天想在asp.net页面中,显示word文档的内容,试了几种方法,都得不到满意的结果,用streamreader和filestream来读的时候,不管用哪种编码形式,页面都存在乱码。
后来有人说用com组件来读,我也试了,的确不存在乱码了,但是word中的格式全部没有了,页面中密密麻麻的都是文字,一点空隙都没有。请问该怎样读取word文档,并且让它的格式保留下来?
下面是我用com组件读取时写的一个函数来实现的代码,麻烦高手看看要怎样修改才能保留它的格式,或者如果有更好的方法来读取,麻烦你们教教我,谢谢!
public string Doc2Text(string docFileName)
{
Microsoft.Office.Interop.Word.ApplicationClass wordApp = new Microsoft.Office.Interop.Word.ApplicationClass();
object fileobj = docFileName;
object nullobj = System.Reflection.Missing.Value;
Microsoft.Office.Interop.Word.Document doc = wordApp.Documents.Open(ref fileobj, ref nullobj, ref nullobj,
ref nullobj, ref nullobj, ref nullobj,
ref nullobj, ref nullobj, ref nullobj,
ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj
);
string outText = doc.Content.Paragraphs;
doc.Close(ref nullobj, ref nullobj, ref nullobj);
wordApp.Quit(ref nullobj, ref nullobj, ref nullobj);
return outText;
}
一楼和二楼的朋友,能说的具体点吗?