织梦怎么自动采集发布(网页内容编码方式改为GB2312)
三石哥 2022-11-11 15:15:04 176
将织梦网页GBK/GB2312编码转换为UTF-8编码的步骤分析方法
将织梦网页GBK/GB2312编码转换为UTF-8编码的步骤方法,建议大家使用dreamweaver或者Notepad+.当然,网上也有小工具可以把utf-8转码为模板批量gbk。不能用记事本进行更改.前端技术可以通过跳过模版转码的教程.
1、为什么MIP只支持utf-8?
目前通过百度MIP对网页进行编码管理规定,必须发展要是UTF-8编码,那么GBK或者GB2312的网页要怎么办呢?是否可以将GBK或者GB2312编码转换成UTF-8编码呢?答案是可以的。那么我们为什么中国百度MIP只支持UTF-8编码呢?因为现在手机上带的浏览器只支持网页的UTF-8编码,GBK或者GB2312的网页在手机上打开显示的是乱码,所以百度MIP官方为了手机网页的兼容性,规定MIP网页的编码必须是UTF-8编码,建议大家以后设计网页编码也尽量选择UTF-8编码,UTF-8编码不仅是国际主流编码,而且也会导致网页所占空间也会减小,以下教程也适用于其它的PHP程序cms系统。GBK/GB2312编码转换为UTF-8编码一个大概的步骤分析方法是先将网站系统程序替换成UTF-8编码,再将网站模版数据进行转码,最后我们再进行数据库的编码转换,具体操作步骤教学方法通过讲解内容如下:
2、先备份原GBK或者GB2312网站程序
在转换网站代码之前,请备份GBK(GB2312)原始网站程序。具体步骤如下:
(1)利用智盟CMS项目后台数据库备份功能对网站数据库进行备份。步骤如下:点击系统-系统设置-数据库备份/恢复,点击下面的“提交”按钮对原程序数据库进行备份,备份的长度取决于数据库的大小。
(2)网站数据库备份完成以后,再将网站根目录下的所有文件进行打包下载到自己本地电脑中,防止转码失败,导致网站不能正常运行,完整的织梦网站分为三个部分,一个为织梦cms官方程序,一个为网站前台模板程序,最后一个就是网站数据库文件,需要依次对这三个部分进行转码操作,网站数据库文件转码可以利用帝国数据备份王进行转码,再将织梦UTF-8的程序替换原有的GBK或者GB2312程序,最后用网页编辑器对网站前台模板进行转码。
3、转码工作拆解之数据库转码
网站数据库转码,经过多次的测试,发现用帝国数据备份王进行转码是最为安全的,大家可以百度搜索下载“帝国数据备份王”,下载后将得到如下文件,如下图所示:
帝国数据备份王“upload”这个文件夹名称可以改成其它的文件夹名称,例如我们可以将“upload”改成“beifen”,放在网站根目录下面,访问帝国数据备份王,在地址栏中输入“域名/shuju”,帐号为admin,密码为123456,登录成功后出现一个数据库设置界面,将原网站的数据库地址、用户、密码都输入进去,也有可能会提示你要修改登录密码和随机验证码,按照提示修改一下就行了,接着点击下方的“备份数据”,你将会看到原网站程序的数据库名称,点击“备份数据”出现的界面很关键,因为这一步将会进行网站数据库转码操作。
我们手动选择“utf-8”编码,将网站数据库备份出来,这时候备份出来的数据库编码就是UTF-8编码了,转码完成的数据库存放目录要记住,因为将网站数据备份完成以后,我们还需要进行还原操作的,在数据库还在之前,我们需要先将网站程序和网站模板进行转码,网站程序和网站模板转码完成以后,再还原转码后的网站数据库。
4、转码工作拆解之程序转码
网站程序转码大概步骤是,先保留好原有的GBK或者GB2312程序备份包,再将原有程序空间的程序清除干净,网站根目录下的“帝国数据备份王”千万记得不要清理了,到时候恢复网站数据库还要用到,将在织梦官网下载好的织梦UTF-8编码程序解压上传到网站空间内。
安装步骤详解请看《织梦cms系统MIP改造教程方法步骤》这篇文章,下面我们直接讲解织梦cms模版转码操作。
第1步,在本地电脑浏览器地址栏中输入,你的域名/install/index.php,开始安装织梦程序
第2步,勾选“我已经阅读并同意此协议”,点击继续,进行程序的下一步安装。
第3步,如果上图中“继续”按钮是可点状态,直接点“继续”进行程序的下一步安装,出现的红叉就不用管了,如果“继续”按钮是不可点击状态,说明你的多站空间有问题,找空间服务商查找相关原因或者自行查找原因。
这个步骤是最重要的一个步骤,上图中“模版选择”我们不需要进行任何操作,“数据库设定”按照空间商给的信息依次输入“数据库主机”、“数据库名称”、“数据库用户”、“数据库密码”、“数据表前缀”、“数据库编码”,“数据表前缀”可改可不改,“数据库编码”默认的也不需要修改。
“管理员帐号密码”这块设置你网站后台管理的帐号和密码,自己记着就行,Cookie加密码一定不要动。
“网站设置”这块,网站名称填入你网站的品牌名称即可,其它的地方就不需要动了,”安装初始化数据进行体验“这个复选框不要勾选,最后点击”继续“按钮完成程序的安装,下图中附上织梦cms程序安装的参数设置,大家可以参考一下。
如果出来以下图示的界面,则证明你的织梦和序安装成功了
织梦cms程序转码部分这里就完成了。
5、网页前台页面模版转码
这个步骤一定要使用专业网页编辑软件进行转码,例如dreamweaver或者Notepad+,也可以使用网站针对GBK(gb2312)转码utf-8的小工具软件,千成记得不要用记事本进行转码操作。
首先将原GBK(gb2312)网站前台模板下载下来,一般是在templets文件夹下的default文件夹中,下面以dreamweaver网页编辑软件教大家如何将GBK(gb2312)模板转成utf-8。
用dreamweaver网页编辑软件打开一个前端模版文件,依次点击软件菜单中的修改—页面属性—标题/编码—编码,如下图所示:
我们将原模版文件简体中文(GB2312)选择成 Unicode(UTF-8),
单击确定,模板文件将成功转换为 utf-8编码。重复上述方法,将所有其他前台模板文件转换为 utf-8编码。
6、恢复网站
网站模板文件转码完成后,网站转码尚未完全完成,数据库尚未恢复。在这里,我们将再次使用“帝国数据备份王”来恢复网站数据库。步骤如下:点击“备份和恢复数据库”下的恢复数据,然后选择数据源目录,也就是刚刚备份的数据库目录,在下面选择要导入的数据库,然后选择数据表(也就是原来的网站数据表),点击开始恢复。恢复网站数据库后,将 gbk (gb2312)编码完成网站 utf-8编码,到此阶段可以进行网站模板 mip 转换。
7、转码注意事项
1)如果原GBK(gb2312)编码程序已经过二次开发或其他程序更改,则不建议转码
2)节目转码完成后,我们需要在后台确认操作。方法步骤为系统设置-系统基本参数,最后点击确定
3)如果更新网站出现错误,在后台点击生成-自动任务-更新系统缓存,尽量不要解决你的问题
4)尽量对Dreamweaver模板标签使用兼容的模板标签。织梦的转码操作教程也可以应用到其它的PHP程序cms系统,大家如果还有其它总结,欢迎在下方留言评论,会及时回复大家。
织梦采集,织梦采集规则,织梦采集技巧方法(图文教程)
织梦采集,整合了织梦DEDE发布接口,提供有织梦自动采集、织梦自动更新、织梦自动发布等强大的功能,让站长们可以轻松地建立织梦网站或者织梦CMS站群,织梦CMS作为开源的程序,能配上织梦采集管理,将会帮助站长更好的管理网站和网站建设。
网站的核心是什么?是内容,虽然说对于seo来说,最好是能够进行伪原创、甚至原创,但是很多站长每天并不一定有太多的的时间来进行内容的创作。于是很多站长开始想法子进行织梦采集内容从而填充网站的内容。站长最大的心愿是提供最丰富的网站内容,吸引更多地访问量;织梦采集好比一双慧眼,让您看得更远,获得更多。
站长希望将别人的整站织梦采集数据下载到自己的网站里或者将别人网站的一些内容织梦采集保存到自己的服务器上。织梦采集从内容中抽取相关的字段,发布到自己的网站系统中。有时需要将网页相关的文件也保存到本地,如图片、附件等。
织梦采集会定时从同一网站上抓取内容,希望已经抓取的内容不要再发布到网站系统中。对于一些网站,需要登陆才能获取页面。站长希望通能够通过一个内容列表页面获取所有的相关内容,织梦采集包括内容列表的其它分页。当第二次抓取相同网站时,织梦采集不要再重复第一次的设定。
织梦采集多样化的采集目标,信息分布在各种信息存储系统中,各种存储系统有着各自的交互机制,需要织梦采集提供多种并可扩展的连接模块。织梦采集多样化的数据格式,信息以多种形式存在,如网页、word文档、pdf等。这些不同的格式数据需要织梦采集采用不同的采集机制。
织梦采集分布式海量数据,由于网络通信的延时和网络带宽的限制,并发多线程通信能够有效地减低延时和抢夺资源。织梦采集数据横向和纵向采集,需要织梦采集自动采集数据的下一页;自动采集数据的关联附件;自动根据当前采集结果采集下一数据。站长操作简单、快捷,多样且复杂的数据格式增加用户的作业难度,用户希望所见及所得,织梦采集及时提供相应的操作提示信息。
织梦采集实现网站内容采集的方法,获取被采集的页面的内容,ASP常用获取被采集的页面的内容方法:
用serverXMLHTTP组件获取数据
Function GetBody(weburl)
'创建对象
Dim ObjXMLHTTP
Set ObjXMLHTTP=Server.CreateObject("MSXML2.serverXMLHTTP")
'请求文件,以异步形式
ObjXMLHTTP.Open "GET",weburl,False
ObjXMLHTTP.send
While ObjXMLHTTP.readyState <> 4
ObjXMLHTTP.waitForResponse 1000
Wend
'得到结果
GetBody=ObjXMLHTTP.responseBody
'释放对象
Set ObjXMLHTTP=Nothing
End Function
调用方法:GetBody(文件的URLf地址)
织梦采集或者用XMLHTTP组件获取数据
Function GetBody(weburl)
'创建对象
Set Retrieval = CreateObject("Microsoft.XMLHTTP")
With Retrieval
.Open "Get", weburl, False, "", ""
.Send
GetBody = .ResponseBody
End With
'释放对象
Set Retrieval = Nothing
End Function
调用方法:GetBody(文件的URLf地址)
这样获取的数据内容还需要进行编码转换才可以使用
Function BytesToBstr(body,Cset)
dim objstream
set objstream = Server.CreateObject("adodb.stream")
objstream.Type = 1
objstream.Mode =3
objstream.Open
objstream.Write body
objstream.Position = 0
objstream.Type = 2
objstream.Charset = Cset
BytesToBstr = objstream.ReadText
objstream.Close
set objstream = nothing
End Function
调用方法:BytesToBstr(要转换的数据,编码)'编码常用为GB2312和UTF-8。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 3561739510@qq.com 举报,一经查实,本站将立刻删除。
转载请注明来自专注SEO技术,教程,推广 - 8848SEO,本文标题:《织梦怎么自动采集发布(网页内容编码方式改为GB2312)》
标签:
- 上一篇: 如何操作自媒体运营(自媒体的快速发展)
- 下一篇: 百度搜索的答案都准确吗(搜索关联账户时发生错误)
- 搜索
- 最新文章
- 热门文章
-
- 快手新人开直播十大技巧是什么?快手新人直播技巧有哪些?
- 网站关键词确定方法:精准定位,提高搜索排名
- SEO关键词优化如何提高网站排名?SEO关键词排名提升方法是什么?
- 搜索关键词如何让排名靠前?揭秘关键词排名提升方法
- 抖音视频上热门标准是什么?抖音视频上热门条件有哪些?
- 如何进行网站头部标签的优化设置?
- 抖音标题如何写?抖音标题写作技巧是什么?
- 快手点赞对主播有什么好处?快手点赞主播收益是什么?
- 如何优化网站图片以提升主题相关性(掌握图片优化技巧)
- 网站标题优化技巧:提升搜索排名,吸引更多流量
- 如何进行网站图片优化(优化网站图片的好处和具体方法)
- 快手播放量1000代表什么?快手播放量1000意义是什么?
- 抖音直播带货佣金如何计算?抖音直播带货佣金模式是什么?
- 如何优化网站排名以提升流量?揭秘网站排名提升的五大策略
- SEO作弊和惩罚分析是什么?SEO作弊惩罚机制是什么?
- 抖音与快手流量对比分析:谁更胜一筹?
- 网站图片优化对排名的影响(如何通过图片优化提高网站排名)
- SEO引流如何做效果更好?SEO引流技巧有哪些?
- 快手评论如何发图片?快手评论图片发布方法详解
- 抖音在线状态不显示问题解决方法(探究在线状态显示时间)
- 热门tag