用编程的方式根据对象模型很容易实现在Word、Excel文档中搜索文本,在PowERPoint里面也同样如此,使用对象模型有助于我们了解Office的文档结构。
搜索的思路和方法基本是相同的,用PowerPoint应用程式对象打开指定的文档,用文档对象获取文档,再使用合适的对象将文档分割成搜索范围适中的对象进行搜索。
打开PowerPoint的VBA帮助文档VBAPP10.CHM,根据对象模型图,很容易找到我们需要的几个集合和对象:Application、Presentations、Presentation、Slides、Slide、TextFrame、TextRange。其中Presentation代表一个 PowerPoint 文档,Slide表示PowerPoint文档中的单张幻灯片,TextFrame是幻灯片上的文本框,TextRange是文本框中的文本。
打开PowerPoint文档:
string filename="";
PowerPoint.Application pa=new PowerPoint.ApplicationClass();
PowerPoint.Presentation pp=pa.Presentations.Open(filename,
Microsoft.Office.Core.MsoTriState.msoTrue,
Microsoft.Office.Core.MsoTriState.msoFalse,
Microsoft.Office.Core.MsoTriState.msoFalse);
Open()方法的第三个参数在帮助文档中的说明如下:
Untitled 可选。MsoTriState 类型。指定文档是否有标题。
因为是Untitled,所以按照上面的代码,打开文档之后才能引用PowerPoint文档的标题,假如不想使用标题,就要把枚举msoFalse改成msoTrue。
搜索文本:
string[] strKeyWordList={}; //要搜索的文本
PowerPoint.TextRange oText;
foreach(PowerPoint.Slide slide in pp.Slides)
{
foreach(PowerPoint.Shape shape in slide.Shapes)
{
foreach(string strKeyWord in strKeyWordList)
{
oText=null;
oText=shape.TextFrame.TextRange.Find(strKeyWord,0,Microsoft.Office.Core.MsoTriState.msoFalse,Microsoft.Office.Core.MsoTriState.msoTrue);
if (oText!=null)
{
MessageBox.Show("文档中包含指定的关键字 " strKeyWord " !","搜索结果",MessageBoxButtons.OK);
continue;
}
}
}
}
当用wps提供的com时,程序也是类似的,如下程序得到ppt文本内容:
objPresSet = application.Presentations;
objPres = objPresSet.Open(sourceFilePath, "", KsoTriState.ksoFalse, KsoTriState.ksoCTrue, KsoTriState.ksoFalse);
foreach (Slide sld in objPres.Slides)
{
foreach (WPP.Shape sp in sld.Shapes)
{
fileText+= sp.TextFrame.TextRange.Text;
}
}
excel文档示例:
ET.ApplicationClass application = null;
ET.workbook book = null;
try
{
application = new ET.ApplicationClass();
book = (ET.workbook)application.Workbooks.Open(sourceFilePath, type, type, type, type, type, type, type, type, type, type, type, type);
foreach (ET.Worksheet wk in book.Worksheets)
{
foreach (ET.Range s in wk.UsedRange)
{
fileText += s.Text;
}
}
book.ExportPdf(pdfpath, "", "");//this.GetFilePath(path)是获取文件路径+文件名(不含后缀)
}
word最简单了:
WPS.ApplicationClass application = null;
_Document doc = null;
try
{
application = new WPS.ApplicationClass();
doc = application.Documents.Open(sourceFilePath,false,false,false,"","",false,"","",1,1,true,false,1,true);
fileText = doc.Content.PlainText;
doc.ExportPdf(pdfpath,"","");
}