网创优客建站品牌官网
为成都网站建设公司企业提供高品质网站建设
热线:028-86922220
成都专业网站建设公司

定制建站费用3500元

符合中小企业对网站设计、功能常规化式的企业展示型网站建设

成都品牌网站建设

品牌网站建设费用6000元

本套餐主要针对企业品牌型网站、中高端设计、前端互动体验...

成都商城网站建设

商城网站建设费用8000元

商城网站建设因基本功能的需求不同费用上面也有很大的差别...

成都微信网站建设

手机微信网站建站3000元

手机微信网站开发、微信官网、微信商城网站...

建站知识

当前位置:首页 > 建站知识

如何解决php读取word中文乱码问题

php读取word中文乱码的解决办法:1、查看php版本;2、修改php.ini并且重启服务器;3、通过“iconv('GB2312', 'UTF-8', $test);”解决读取过程中乱码问题即可。

创新互联建站专注于会昌网站建设服务及定制,我们拥有丰富的企业做网站经验。 热诚为您提供会昌营销型网站建设,会昌网站制作、会昌网页设计、会昌网站官网定制、小程序定制开发服务,打造会昌网络公司原创品牌,更为您提供会昌网站排名全网营销落地服务。

本文操作环境:Windows7系统,PHP7.4版,Dell G3电脑。

如何解决php读取word 中文乱码问题?

php读取word文件过程中乱码,怎么解决?

一、首先要确认php版本,最好是高于5.6

二、启用PHP Com 扩展

// 将以下两行代码放入php.ini中, 并且重启服务器// 开启扩展extension=php_com_dotnet.dll// COM扩展里自带的,只需将前面的;去掉就可以了com.allow_dcom = true

三、代码如下:

public function readWord($url) { $word = new COM("word.application") or die("Unable to instantiate Word"); // 打开路径为URL的word,doc或docx都可以 $word->Documents->OPen($url); // 读取内容 $test= $word->ActiveDocument->content->Text; // 统计字数 // $num = strlen($test); // 解决读取过程中乱码问题 $content= iconv('GB2312', 'UTF-8', $test); // 查看版本 // $word_wersion = $word->Version; // 是否要打开文件,0代表否,1代表是 $word->Visible = 0; // 关闭word句柄 $word->Quit(); // 释放对象 $word = null; return [ // 'num' => $num / 2, // 'word_wersion' => $wordWersion, 'content' => $content ]; }

注意:

问题一:

文件url有一个地方需要注意,就是你们传进来的url千万不能是绝对地址,不能是D:\\WWW\\这种,,一定要自己框架的路由地址,比如localhost/…,不然会出现错误,因为用绝对地址读取word内容,只能读取一次,然后word就会被锁定,然后就无法读取了。

问题二:

使用这种方式虽然解决了读取Word内容乱码的问题,但是只限于读取纯文本的Word,而且是没有样式的那种。如果需要获取Word文档的内容包括样式、图片、字体等,这种方式就不适合。

我们处理的方式是,采用Aspos。用Java做了一个底层服务,把上传的Word文档都转成html格式的,如果文档中有图片的话,转换后图片会被提取到同级目录,并在生成的html文件中留下标签。 这样Word文档中的字体和样式就变成了了HTML代码,程度保留了原文档的样式。

推荐学习:《PHP视频教程》


文章标题:如何解决php读取word中文乱码问题
文章位置:http://bjjierui.cn/article/cjhsdi.html

其他资讯