如何用c#读取word中的某一段文字

如题所述

三种方法:
一是直接读取.doc文档,可以将所有的文本读入到字符串中在做相关处理:

C# code?

1
2
3

using System.IO;

string temp = System.IO.File.OpenText(@“D:\word.doc”).ReadToEnd();//读取doc文档

二是通过调用.NET对于Office的COM组件来做:

C# code?

1
2
3
4
5
6
7
8
9
10
11
12
13

using Microsoft.Office.Interop.Word;

Microsoft.Office.Interop.Word.Application app = new Microsoft.Office.Interop.Word.Application();//打开word程序
Microsoft.Office.Interop.Word.Document doc = null;//实例化一个新的word文档

object unknow = Type.Missing;
app.Visible = true;
doc = app.Documents.Open(ref fileName,
ref unknow,ref unknow,ref unknow,ref unknow,ref unknow,
ref unknow,ref unknow,ref unknow,ref unknow,ref unknow,
ref unknow,ref unknow,ref unknow,ref unknow,ref unknow);

string temp = doc.Content.Text.Trim();//将全篇内容存入字符串中,也可以调用别的方法,具体可以查询MSDN...

三是将Word转为XML,可以根据要求提取内容,包括标题,目录等等~~

C# code?

1
2
3
4
5
6
7
8
9
10
11

using System.XML;

XmlDocument doc = new XmlDocument();
doc.Load(filePath); //载入XML文档

XmlElement root = doc.DocumentElement; //定义载入XML的根节点

foreach(XmlNode xn1 in root.ChildNodes) //对于根节点以外的子节点做循环,以下同理
{
//对元素处理~~~
}

http://bbs.csdn.net/topics/280041104
温馨提示:答案为网友推荐,仅供参考