Discuz教程网

discuzX1.5 完美google百度sitemap (支持自定义根目录)

  [复制链接]
authicon dly 发表于 2011-4-9 09:32:48 | 显示全部楼层 |阅读模式
插件作者: bugx 无法下载,请举报
插件编码: GBK简体 UTF8简体 BIG5繁体 UTF8繁体 
适用版本: Discuz! X1.5 
支持站点: http://www.hlbo.net
作品介绍: google 百度 sitemap for dzX1.5生成器 release
计划任务增量生成google/百度sitemap

今天发现bugx发布了一个google和百度的sitemap插件很好用,但是我的DiscuzX1.5不是放在跟老目录,而是放在子目录的用起来有些失望,并且google和百度的sitemap不怎么对称,虽然,google是我们站长的首选考虑,但百度也不可小视啊,哈哈.....为公平起见我将两者公平对待了。

此乃“完美”之由来。当然我并非认为,bugx的杰作不好,相反我认为其作品很实用,并且有进一步美化之必要。所以我做了近一步的工作,将其完美了一下。下面我讲原文引用过来,其中红色字体为新家内容,且需要注意的地方:



特点:
1、计划任务文件生成google sitemap。每天定时生成,也可以每小时生成
2、可生成门户文章,论坛帖子,个人主页,日志页面,群组页面
3、只支持伪静态页面。(我想不做伪静态的1.5也不需要sitemap了吧)
4、支持门户,论坛,群组,家园自定义域名
5、支持,文章,帖子,主页。群组的自定义伪静态页面
6、定时增量生成sitemap,无需全部生成一次。
7、增量不增文件,不产生多余的文件,不出现重复页面(如果没有子域名,会有每个栏目首页的重复一次,这个自己注释掉即可,问题不大)。
8、支持定义每页生成的数量。
9、支持断点生成地图,出现错误,修正后继续生成。
10、支持自定义生成目录(有的网站非常多的记录数,在根目录生成太多的文件,很不美观。也不方便管理。对安全性设置也不好)

安装:

只有一个文件,先打开文件配置下参数
/*用户自定义配置开始*/
//如果你改动过参数,请删除网站地图目录下所有的地图文件以及data下sitemap.log文件。重新生成一次。

$sm_step=100; //单次执行次数,根据自己需要修改

$bbs_page="thread"; //bbs的静态页面规则,默认thread-xxx-1-1.html格式

$portal_page="article";//portal静态页面规则,默认为article-xx-1.html格式

$home_page="space";//用户个人主页静态页面规则,默认为space-uid-xxxxx.html

$group_page="group"; //群组静态页面规则,默认group-{fid}-{page}.html

$sitemap_path="/data/sitemap/";//sitemap的XML文件保存的路径,文件夹需要自己建立 注意此处一定要有"/"



$main_manu="/Dzx1.5";//Dzx1.5所放目录。注意此处一定要有"/"

/*用户自定义配置结束*/
上传到source\include\cron目录下。
ftp上建好sitemap的生成目录,并给予可写权限。默认根目录
添加一个计划任务,取名为 “google地图任务”。编辑这个任务,任务脚本里写 cron_sitemap.php(这个文件名不可更改)
设置好运行时间。


第一次运行,最好手工执行一下。先把老的数据生成。

程序会在data目录下生成一个日志文件sitemap.log,不可随意删除。


生成完成后,生成4个索引sitemap
portal_sitemap.xml
forum_sitemap.xml
home_sitemap.xml
group_sitemap.xml

把这4个索引文件根据你的域名分配提高到各自的站点工具下,(切记,不然会出现google的警告错误)

可以编辑robot文件
在最后添加写入让搜索引擎自动找到你的sitemap
Sitemap: http://论坛域名/data/sitemap/forum_sitemap.xml
Sitemap: http://群组域名/data/sitemap/group_sitemap.xml
Sitemap: http://家园域名/data/sitemap/home_sitemap.xml
Sitemap: http://门户域名/data/sitemap/portal_sitemap.xml


大家测试,免费一周哦。正式版下载要些金币啦。

有bug的跟贴反应。

后续更新计划
生成baidu sitemap
生成相册图片sitemap

10-29日更新
修正了sitemap版本,采用最新的0.9的。原来的版本里用了0.84的
修正了索引文件的格式
由于data目录是被robot禁止的,默认路径改为/sitemap/
更改索引文件为sitemap.xml
修正索引文件中无效的域名页面,去除了sitemap.xml本身被包含的错误(10:31分之前的一个文件有错误)
21:40分最后更新
将一个整合的sitemap分成4个子域名分别的独立sitemap。避免提交错误
将默认路径改为根目录,解决google提交的错误。
经过测试提交到google,50多万页面很完美被收录,没有再提示错误。

后记:
经过我观察发现,baidu是兼容这种sitemap的。在百度中,我的家园日志收录“找到相关网页约141,000篇”
以前的情况,日志是很难收录的。但是把sitemap写入到robot和做到网站链接上,这个收录非常明显的改善了。
但是问题在于百度有时候乱收入链接,明明将/space.php*写入到robot里,还是会收录这种动态的链接。
这个改为/space.php?uid=*后不知道会不会好一些。继续观察。



有人碰到一种问题,就是生成的sitemap在的,而4个索引文件为空,那么2种可能性。
1、前面你已经下载过这个插件,运行过一次了。删除data/sitemap.log文件,重新执行下即可
2、PHP低于5.0 或者为了安全禁用了scandir函数。
替换方法
在文件最下面增加一个函数

  1. function sdir($dir)
  2. {
  3. $dh = opendir($dir);
  4. while (false !== ($filename = readdir($dh))) {
  5. $files[] = $filename;
  6. }

  7. sort($files);



  8. rsort($files);

  9. return $files;

  10. }
复制代码


附件下载:
游客,如果您要查看本帖隐藏内容请回复






上一篇:一个java学习网站
下一篇:Discuz X1.5论坛音乐模式开启修正版
authicon xpfox 发表于 2011-4-14 01:49:01 | 显示全部楼层
看看,好像不错
authicon snowolf 发表于 2011-4-16 18:22:20 | 显示全部楼层
不错 感谢 用一些
authicon sinji 发表于 2011-4-18 23:03:11 | 显示全部楼层
不錯用的插件   感謝分享 ^^
authicon zhen3071 发表于 2011-4-21 11:12:14 | 显示全部楼层
有人碰到一种问题,就是生成的sitemap在的
authicon 南风哥 发表于 2011-5-4 20:09:18 | 显示全部楼层
雅蠛蝶~~雅蠛蝶~~
authicon 82654942 发表于 2011-5-4 20:43:06 | 显示全部楼层
不用看也知道是精品
authicon yuanyireet 发表于 2011-5-7 10:57:46 | 显示全部楼层
google 百度 sitemap for dzX1.5生成器 release
authicon njy1239 发表于 2011-5-8 14:02:08 | 显示全部楼层
不错
authicon rin421 发表于 2011-5-12 14:59:57 | 显示全部楼层
顶你一下,好贴要顶!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

1314学习网 ( 浙ICP备10214163号 )

GMT+8, 2025-6-10 12:27

Powered by Discuz! X3.4

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表