Joomla首页用PHP代码判断普通用户和搜索蜘蛛

偶看有个Joomla需要判断用户浏览器语言来执行跳转,而判断浏览器语言的前提是需要判断浏览网站的是普通用户,还是搜索引擎的蜘蛛。

joomla-spider

偶看在刚开始使用的是PHP的$_SERVER[‘HTTP_REFERER’]函数,经过两天时间查看网站的百度快照发现,网站首页在百度的快照出现错误,跳转到另外一个网站上了。偶看赶紧修改判断函数,经过分析需要使用$_SERVER[‘HTTP_USER_AGENT’。

在Joomla模板下的index.php页面顶部添加

$app = JFactory::getApplication();
$menu = $app->getMenu();
if ($menu->getActive() == $menu->getDefault()) { 
 $ua = strtolower($_SERVER['HTTP_USER_AGENT']);
    $botchar = "/(bot|crawl|spider|slurp|yahoo|sohu-search|lycos|robozilla)/i";
    if(!preg_match($botchar, $ua)  && $_SERVER['HTTP_REFERER') {//判断为非搜索引擎,而且是直接访问的用户
  $lang = substr($_SERVER['HTTP_ACCEPT_LANGUAGE'], 0, 4); //只取前4位,这样只判断最优先的语言。如果取前5位,可能出现en,zh的情况,影响判断。 
  if (preg_match("/zh/i", $lang)){
   header('location:'.'http://www.oukan.net');
  }
 }
}

这样即可在Joomla网站的首页,通过PHP代码判断访问网站的是普通用户,还是搜索蜘蛛。如果是普通用户,而且浏览器的默认语言是中文,及跳转到中文网站;如果是搜索引擎,不进行任何判断。

偶看博客在各大搜索引擎的近况

自从偶看博客被百度K站后,偶看很少关心博客的排名,因为百度一家独大,博客都被百度K了,还有啥排名可以关心的?

今天,偶看偶然查询下博客的排名,发现博客有部分排名在百度中已经恢复,但是参与排名的网站数据都是有些时日的,估计不太稳定。

偶看顺便查询博客在其他搜索引擎的情况,通过查询搜狗、SOSO、360搜索、谷歌和Bing,除了搜狗、SOSO其他几个搜索引擎收录的偶看博客状态正常。

偶看博客在搜狗中的搜索结果

在搜狗搜索“www.oukan.net”,偶看发现,搜狗评级已经有4,而且出现了Sitelinks,这让偶看感到惊讶,看来搜狗还是挺看好偶看博客的,可惜搜狗没啥市场份额。搜狗收录的偶看博客首页标题更新挺勤快,而首页描述至少是一年半前的,难道就不能更新下数据?

偶看博客在SOSO中的搜索结果

SOSO则表现比较夸张,在收录的网页中,网页标题和描述都没啥问题,但是网页快照时间出现了重大失误——2006-03-21,这个时间,貌似偶看博客好像还没有建立,SOSO这是要闹哪样?

最近,偶看研究Joomla多一些,以后应该会转向网络营销方面,对于偶看博客在搜索引擎的排名就顺其自然了。

偶看《电商网站导流关键词分析》

偶看刚在微博上看到2013年2月10日-3月9日电商网站导流关键词分析(来自Hitwise)。

搜索引擎的电商网站导流关键词分析

看到这则微博,偶看第一个想到的是马云在早期就在robots里面屏蔽百度蜘蛛的决策真是太英明了。淘宝和天猫相关关键词搜索为电商导流的5%,流量的绝大部分都是免费流量。“京东商城”和“京东”占搜索为电商网站导流点击的2.5%,而其中57.3%为付费流量,光付费点击这一块的费用,京东商城就不知道要比淘宝多花多少冤枉钱。

“淘宝商城”在广大网民心中的知名度高于“天猫”,这点还真是比较有意思,不过天猫建立的时间并不长,还需要继续提高知名度。

“京东商城”和“一号店”使用“淘宝”这个关键词来进行竞价,貌似效果还不错的样子,只是这样不知道算不算侵权,如果是在谷歌是否允许投放?

在搜索引擎中,只有淘宝系活得自由自在,其他的电商平台都需要投放竞价(或者更直接地说是百度竞价),这块业务的成本不低,而淘宝已自成SNS导流系统,在电商的竞争中将会越来越强大。

电商,还是电伤?京东烧钱伤不起啊!

百度和谷歌对301重点向的反应周期

偶看在10月19日对网络营销博客进行重大改版——《偶看博客重大改版,静观效果》,对收录影响比较大的就是将情侣博客从子目录中分出,成为一个单独的网站。偶看将情侣博客整个目录通过301重定向。

在对谷歌的搜索结果进行研究发现,子目录的301重定向在第二天,即10月20号就产生效果,谷歌已经开始收录部分网页。通过谷歌网站管理员工具查看,爱林家园情侣博客在10月28号谷歌更新时被编入索引,首次编入索引的网页总数为2845个。

反观百度目前对爱林家园的收录,通过site命令查询,百度在10月14日左右,收录第一个页面:爱林家园的手气不错页面,这是一个产生随机文章的页面,而非首页,这也从侧面说明,百度对新鲜内容的喜欢。情侣博客最新一篇文章是10月10号写的,这和百度收录也会有一定的关系。

网络营销博客索引量

偶看通过百度站长平台中对爱林家园进行站点索引量查询,结果为“抱歉,此段数据暂无”。再查询偶看网络营销博客的站点索引量,在11月9日,网站索引量减少733个,下滑34%,至1425;查看博客下love子目录的收录状态,在11月1日,收录量由858减少为零。

love子目录索引量

从10月19日到11月1日一共是13天,也就是半个月左右,百度对love子目录的301重定向已经反应过来。

有个很奇怪的问题,为什么love子目录在11月1日减少858的收录,而偶看网络营销博客全站的收录没有相应减少,在11月9日才显示出整站收录减少的情况呢?

SEO基础:中国搜索引擎排名

既然SEO是搜索引擎优化,那么我们就来了解下2012年9月中国搜索引擎的使用率和市场占有率。

中国搜索引擎排名

使用率:某款搜索引擎产生的页面浏览量占总页面浏览量的比例。

占有率:使用某种搜索引擎的独立访客数在总独立访客数中所占的比例。

通过这张表,我们可以很清晰地看出中国搜索引擎排名

第一集团:百度。百度作为国内搜索引擎的老大,目前大家所做的SEO还是针对它。百度一调整,站长就感冒;百度一K站,站长就失业。

第二集团:搜狗、360搜索、谷歌、搜搜。360搜索从8月份推出到现在,市场占有率和已经搜狗不相上下,从360安全卫士起家的360,凭借其360浏览器强大的市场占有率,对百度发起强有力的挑战。目前360搜索已经推出品牌直达,据称推广也在测试,正式上线时间未知。

谷歌由于种种原因,在国内的市场不断下滑,目前仅剩下5%。谷歌的搜索引擎技术一直都在引领国际的潮流,如果想学习真正的SEO技术,那么研究谷歌绝对是您的方向。

第三集团:必应、有道、雅虎、中搜、奇虎等。这些搜索引擎大家稍微了解下即可。

各大中文搜索引擎下拉框测试

偶看使用“哪里”这个关键词在各大中文搜索引擎的搜索框测试下拉框,有很多有意思的现象。

作为中文市场占有率最高的搜索引擎,在百度搜索引擎,输入“哪里”,从截图中您可以看出,国人们最喜欢搜索什么了。

谷歌搜索的下拉框提示比较全面,涵盖多个行业,但是其第三个提示比较神奇,估计是iphone的杰作。

360搜索引擎作为一个一家后起之秀,其“哪里”的下拉框提示主要以图片和视频为主,其他内容相对较少,用户的搜索比较单一。

搜狗的下拉框第一名竟然是买**种子的,这个压力很大,需要好好处理一下,要不后果可就严重了。

SOSO用户似乎也比较空虚,而且想赚钱的比较多。

bing用户想看视频的也不少,和百度有得一拼啊。

从“哪里”这个关键词来看,看片才是王道。“哪里好玩”是各大搜索引擎的常驻关键词。“哪里看奥运直播”这则是上个月的关键词,过一段时间应该就会消失了。

搜索引擎蜘蛛来访分析

偶看使用网站日志分析工具查看了从8月1号到15号所有的搜索引擎蜘蛛来访互联网那些事的概要。

偶看对各大搜索引擎蜘蛛来访进行一个基本的分析。

因为偶看博客属于中文站,来访的搜索引擎蜘蛛以Sougou Spider、BaiDu Spider、谷歌蜘蛛为主,这三个搜索引擎的总停留时间超过597.03小时,占所有来访蜘蛛的84.35%,而这三大搜索引擎的总抓取量是26094,占总抓取量的82.83%。

搜索引擎蜘蛛来访分析

Sougou Spider访问次数138次,相对比较少,但是停留时间长且抓取页面最多。

BaiDu Spider访问最勤快,停留时间长,抓取页面多。

谷歌蜘蛛访问132次,停留时间最长,抓取页面多。

SOSO访问次数多,但是停留时间短,抓取页面也不多,这是什么原因?需要进一步分析。

其他还有一些常见的搜索引擎蜘蛛偶尔来访互联网那点事,而偶看比较少见到的蜘蛛DoCoMo Spider,这是日本NTT DoCoMo 旗下的搜索引擎