华中科技大学所有域名被Google加入过滤网址,教务处难逃其责

为了让这件事情处理得更加“得体”一点,和谐一点,我提醒一下:本文中的结论只是我的主观猜测,大家请根据自己的智力判断,不要被我的愤怒所影响你们的判断,谢谢。欢迎批评,留言开放。

近期,华中科技大学旗下所有网址(*.hust.edu.cn),包括几乎所有二级域名(如电子信息工程系主页ei.hust.edu.cn),都被Google判为“有害网站”。我相信这一信息并不是上次Google误判所造成的:为什么只有华中科技大学的网站出事儿了?

我严重怀疑这与华中科技大学教务处网站之前私下出售连接位置有关。我觉得这绝对不是什么“黑客入侵”那么简单 – 教务处方面在接到举报之后居然几周都没有把链接拿下来,实在是可疑!教务处里面某几个无赖除了收重修费或者毕业时喜欢整点潜规则之外,连官方页面都敢卖,真过分!

附:华中科技大学教务处PR值为8,目前页面已经被整改。连接买卖简单地说就是,通过收买高PR页面链接来赚取更多的搜索引擎“信任”,之后在搜索排名中获得更好排名,看过前几天《新闻联播》的朋友们稍微动动脑子就能知道,现在网民搜色情词是多么猖獗,这其中的欺诈利益非常高。延伸阅读:关于欺诈的文章

附2:虽然学校里面搞行政的人都有一大堆臭毛病,我也不会随便怀疑人干这种事。但这次hust.edu.cn域名作废让我们学校在外丢尽了脸,实在令人愤怒!回头想想这事儿,还的确是很蹊跷:

  1. 教务处网页上有连接的事情在六月初就曝光了,一开始是作为隐藏文本放在页面最下面,全选时可以看到。当时华中大在线的人已经联系到了教务处的网站负责人,而我6号也在白云教务处官方版面发了帖子(当时我虽然也怀疑,但毕竟没有证据,我并没有发帖说任何和“出售链接”有关的事情),对方表示已经知道问题了,但一直没有修改。
  2. 过了几天(至少是三天,请看这篇帖子),变成了典型的Cloak作弊方式:黑色交易都已经被揭穿了,还无耻地继续出售连接 – 这种事情,也只有老罗语录中那种“教务处”的啥老娘们儿才干得出来了:)
  3. 现在Google加入过滤列表之后,为什么瞬间就把链接都删除了?难道这黑客还有这种为所欲为神通广大的本事,就像是钻进领导们的心肺里的虫子一样呢!

附3:Google SafeBrowsing铁证如山:

学校应该对教务处进行严厉整改了,教务处负责人也请不要无耻地把责任直接推卸给学生!还得好好加强PR工作,否则华中科技大学这个牌子就等着慢慢地烂掉吧!

更新:2009年6月24日,域名已经被Google从过滤列表中移除,讽刺的是,收到一封来自Twitter的邮件,告知之前含有hust.edu.cn的一推属于“有害信息”,被强制删除。看来Google这个过滤列表的影响力是极为巨大的,这也为打击互联网欺诈提供了很好的帮助。

5月28日PR值更新,Twitter用户Profile页面纷纷降权

儿童节更新:Google恢复了不少Twitter Profile页面的PR值,看来上次更新可能是数据库数据出错。

今天,5月28日,Google PageRank值更新了。

这次更新似乎针对Twitter作出了比较不利的决策:几乎所有的Profile页面都有所下降。我的Twitter Profile页面曾经是5,而我有好几位圈内好友的Twitter Profile PR都有4-6不等,这次均被降低到1、2不等。似乎Google认为之前太抬举Twitter的用户们了 – 其实2008年时Twitter用户的Profile页面PR确实都很高。

其实,早先,商务社交LinkedIn中许多用户的Profile页面PR值曾经下降过一次,我对比过几位来自Adobe.com FlashPlayer Team的著名工程师和一些Evangelist的PR值(他们在LinkedIn的PR都特别高),都有所下降。只不过,这次轮到Twitter了。

Twitter创始人Evan Williams的Profile PR值已经降为6(之前应该是8),而另一位合伙创始人Dom Sagolla的Profile PR只有4了。

有很多人不喜欢过多地谈论SEO相关的话题,其实我也很反感倒垃圾式的SEO(其实大多数SEO都在这么做),我一直认为PR值Alexa值是两个很重要的指标,虽然基于这二者也有多种作弊、私下交易的渠道,但这它们在业内还真是很难找到替代品,对于咨询公司、投资公司和普通行业观察者来说,不可能不重视这些指标。

2008最后一天Google PageRank更新,附维持PR不降的三个建议

Google PageRank的新一轮更新居然在2008的最后一天到来了,不知这是Google计算机的自动安排,还是手动地送给大家一个“新年惊喜”……

扫盲:Google的PageRank根据网站的外部链接和内部链接的数量和质量俩衡量网站的价值。PageRank背后的概念是,每个到页面的链接都是对该页面的一次投票,被链接的越多,就意味着被其他网站投票越多。这个就是所谓的“链接流行度”——衡量多少人愿意将他们的网站和你的网站挂钩。PageRank这个概念引自学术中一篇论文的被引述的频度——即被别人引述的次数越多,一般判断这篇论文的权威性就越高。

不过,虽然长达数个月的期待终于到来,Google却并没有向以往那样让每一个人都“喜笑颜开”。和最近的几次更新类似,这次PR更新,仍然以降为主。过去的半年里,我有一个坚持原创的技术Blog,由于更新不是特别频繁,也从6降低到了5、然后到4;而我这个blog由于持续地更新,以及谨慎的广告策略,始终保持在6,还是挺欣慰的。

国内大部分门户、政府网站和教育机构网站仍然拥有极高的PR值,而据我所知,我们的信产部仍然是唯一一个PR=10的中文网站

如果你确实在乎PR值,说三点我的个人建议:

  1. 勤奋地更新您的网站,优化用户体验
    Google一直都以用户体验和为用户服务为使命,他们自己的PageRank理念又怎么可能脱离这个逻辑?Google推出工具条和Chrome之后,对一个网站的拿捏就更全面了,通过切实统计到的数据,那些真正为用户服务的网站和SEO工具批量打造下的垃圾站会马上分别开来;
  2. 不要和非关联网站交换链接
    我的Blog和互联网相关,那么我一定只和互联网相关,或者信息化相关的网站交换链接。曾经有不少音乐类网站请求我交换链接,但都被我谢绝了。我猜测,Google内部也会给网站定下一系列的tags和category,并针对两个网站计算出关联度,如果关联度低,那么链接自然是“无效的”或者“低效的”。
  3. 使用Google Analytics(谷歌分析)和Google Webmaster Tool(网站管理员工具箱)
    开诚布公、兼听则明:让Google亲自检验你的网站,说明你有足够的信心去证明你的网站是为用户服务的。而另一方面,Analytics和Webmaster Tool的许多报表也直接反映了用户体验、链接优化程度,我个人使用过多款统计服务,几乎没有能超过Analytics的免费服务。

最后相对那些一直不在乎PR值的朋友们说:Fuck那些狗日的SEO专员和狗日的PageRank,让他们都去死吧。

Alexa在Firefox的官方插件Sparky更新

应该是11月4日的一次更新,Alexa的Sparky升级到1.3.0版。我大致看了一下,新的Sparky在Google的搜索结果页面集成了Alexa的流量条,例如Google“Awflasher”:

 

在流量基本不变的情况下,最近awflasher.com在Alexa的排名持续下降。我猜测这可能是由于Google在中国的市场份额持续欠佳造成:通过Analytics检测到的Google入口流量并不是很好。因为Alexa很可能是和Analytics有“合作”的 – 虽然Google Trends的Websites有取代Alexa的“潜力”,但在2008年多次改版之后,我发现Alexa的流量曲线与Google Analytics的流量曲线,尤其是Referer来自Google的流量曲线非常接近。

不管怎么样,Alexa和Google的合作,是一件好事。

一则基于站长和SEO从业者的欺诈手段

之前,我已经介绍了许多前奇古怪的欺诈方式供大家防备。有一些事我遇到的,有一些事他人遇到的。今天,在王梓靖的Blog看到:

无意中登录了QQ的邮箱,发现在垃圾箱中有一封信,标题是“您的网站由于作弊被处罚的通知”,发件人是”Baidu.com(serve@baidu.com)”,接着去百度了一下这个邮箱,没有任何搜索结果。信的内容如下:

亲爱的站长您好!
我们在最近的检查中发现您的网站存在搜索引擎作弊行为,百度搜索引擎现决定暂不收录您的网站。蜘蛛抓取到的非法页面地址及详细信息见邮件附件。希望您能尽早撤销不合法的页面,以便百度重新收录您的网站。

谢谢合作
http://www.baidu.com

信中有一个附件,Baidu.rar,下载过程中卡巴报压缩包中有木马,内有一chm文档,我立即想起了去年有一次有人打着网站合作的幌子发给我一个类似的chm文档,说是合作文档,我打开后,当天QQ就被盗了!这次这个rar一定也捆绑了盗QQ的木马!!!

后来我分析,此骗子一定是在公司网站上看到了我的QQ号码,看这号码不错,值得一盗,之后一看又是做网站的,发此种百度作弊的不收录的信件,有说服力,我很有可能会打开看,之后就中招。然后找垃圾邮件发送工具,冒充百度官方发邮件给我,骗子真是创意无限啊!

骗子肯定不是盯了一天半天了,假如骗子你能够看到此文,我要告诉你——首先,我的号码是不错,但它是我的,不是你的。大街上姑娘多了,你拉一个过来让人家做你老婆,你愿意人家还不愿意呢!其次,我自己不做网站很多年,我不需要担心被百度惩罚,如果是说公司的网站要受到你所说的惩罚,那第一,这样的事情轮不到你来告诉我,第二,这样的事情发生的可能性=0,除非新浪搜狐这样的网站都已经开始被封。再次,有这些脑子干点正事,你这样的骗来的钱给你孩子买奶粉,那奶粉也是富含三聚氰胺的,多行不义必自毙!

骗子终究是骗子,只要我们仔细思考,骗术还是或多或少有破绽的,这里我也要提醒看到此文的各位朋友,现在骗子多,盯紧自己的东西,QQ申请二代密码保护,不要给骗子们可乘之机,骗子们也是人,只是小聪明多了些罢了。

其实,QQ号的意义随着一代人的老去的确已经失去了它曾经的价值,实际上,腾讯推出TM、邮箱绑定,也是在进一步弱化这种虚拟的“尊贵身份”。尽管如此,仍然替作者足够警惕没有上当而感到高兴,毕竟盗QQ也许只是流氓耍宝的开始。

不过说句题外话,如果那些内容采集垃圾站的制作者或者人肉Spammer的QQ被盗,能不能算一种“黑吃黑”呢:)

热烈庆祝“工业和信息化部”(原信产部)PageRank达10!(图)

博友可能吧同学发现了这个经典的消息,我去看了一下,果然,与Apple、Adobe、Google等知名国际公司一起,原“信产部”成为了我们中国互联网的骄傲!

附:关于PageRank的基本知识:

PageRank 技术:通过对由超过 50,000 万个变量和 20 亿个词汇组成的方程进行计算,PageRank 能够对网页的重要性做出客观的评价。PageRank 并不计算直接链接的数量,而是将从网页 A 指向网页 B 的链接解释为由网页 A 对网页 B 所投的一票。这样,PageRank 会根据网页 B 所收到的投票数量来评估该页的重要性。

此外,PageRank 还会评估每个投票网页的重要性,因为某些网页的投票被认为具有较高的价值,这样,它所链接的网页就能获得较高的价值。重要网页获得的 PageRank(网页排名)较高,从而显示在搜索结果的顶部。Google 技术使用网上反馈的综合信息来确定某个网页的重要性。搜索结果没有人工干预或操纵,这也是为什么 Google 会成为一个广受用户信赖、不受付费排名影响且公正客观的信息来源。

我们中国互联网行业在工业和信息化部的继续领导下,必将谱写新的乐章!

Google PR今日更新,部分网站被降分

国内的站长们要面临一个好消息和一个坏消息,好消息是,盼了N久的PR终于更新了;坏消息是,大部分网站被降权。

的确,我一些做网络营销的朋友告诉我,他们的许多网站都被降权,主要体现在PR5降低到PR3、4;也有部分站长朋友告知采集类网站被降权。

我的blog在这次更新中也有所调整,通过我自己的循环脚本发现,新写的文章页面出现PR4和5的几率更小了,大多数页面只有3和4,不过,可喜的是,我网站下几个PR为6的页面都维持了这个水平。

PR作为Google的核心算法,甚至是形象代言,给枯燥的互联网链接增添了色彩,然而,各种利益的逐渐慎入也使得Google开始调整方式。但我也不太相信Google会放弃PR。我个人认为,抛开人工审核的可能性不谈,Google对PR的调整肯定是增加多种“监控渠道”,例如来自Google工具条、Google搜索行为、Google Chrome的行为、GMail的内容分析,尤其是Analytics反馈的精准用户行为和流量图:相比简单链接跟踪,在Analytics跟踪下的网,才是更加真实的“互联网”。

WordCamp中国:WordPress用户体验改善与SEO的演讲文档

很有幸作为WordCamp Beijing的演讲嘉宾,与大家一同分享我在WordPress用户体验方面所积累的经验。遗憾的是,现场的网络接入非常不好,导致我无法演示在awflasher.com上的实例。我只能尽力“望梅”,但似乎很难“止渴”。这里再次致以最真诚的歉意。另外,据说还有部分Blogger认为我讲的内容不够复杂、高级,这里也感到非常抱歉,因为到场的高手也许不多。更欢迎留言一同切磋复杂和高级的问题。

好在接下来在咖啡厅的闲聊,与很多WordPress用户一对一地分享了彼此的经验,也得知大家对我的优化比较感兴趣,这里就来分享一下我的Presentation:

(由于在Slideshare上传的版本出了故障,大家请看Google和Authorstream的两个版本)

在Google的版本暂时去掉了(因为有用户反应在Reader中会导致页面自动跳转,这种体验太糟糕了)

在AuthorStream的版本:

http://www.authorstream.com/player.swf?p=awflasher-89082-wordcamp-china-presentation-wordpress-ppt-science-technology-powerpoint

Google bot 2.1开始窥测您网站的JavaScript

今天在Analytics记录中查看Google新浏览器Chrome所带来的访问比率时,看到一个名为Googlebot 2.1的user-agent所占份额居然也不小。

这意味着您的JavaScript代码,甚至AJAX应用都会被Google的2.1版机器人爬到。当然,Google作为技术最全面、市场份额最领先的搜索引擎公司,在这方面的努力并非今日才有。只不过,最近2.1版爬虫的“活动频率”提高了。

分析了我目前awflasher.com下的数据,分享如下信息与大家:

  1. 2.1版的爬虫第一次出现在2006年7月23日,随后的相当长时间都没有再次造访,直到2007年的7月26日才又访问了一次;
  2. 2007年7月26日后,平均每个月有一次的访问;
  3. 到2008年4月22日,有一次“爆发”,那一天一共来了14只爬虫:)
  4. 2008年5月之后,访问频率明显增加,几乎每天都有一次访问,有时甚至每日两次访问。

不过,这个2.1的爬虫到底如何从JavaScript取得信息,对于这些信息给予何等权重对待,仍然是一些网站管理员关注的。毕竟搜索引擎吃掉互联网极大的流量:对许多垃圾网站,SEO就是吃饭的工具;而对于正规媒体,SEO业务也是与竞争对手你争我夺的重要领域。

不过,这件事情一定会推动JavaScript技术的进一步发展:用户体验、网站性能都与JavaScript的逻辑、质量密切相关,现今SEO也参与其中了。

如果您也在用Analytics或者其他基于JavaScript技术的流量统计系统,赶紧看看Googlebot 2.1是不是也开始频繁光临了呢:)

Google、Yahoo对SWF进行检索后SEO工作者应该了解的一些基本知识

这是几周前很早的“新闻”了,据说Google和Yahoo对SWF进行了检索。这段时间一直忙着几个基于Facebook和校内API的应用,今天稍有空,简单分享一下我的心得。

首先,我可以肯定的是,Google很早就开始检索SWF了,不仅如此,SWF的URL,也是有PageRank(PR)的。我早年制作的Flash作品,有多个达到PR6并在网络上流传。遗憾的是,并没有SEO工作者注意到这个细节。我想主要是因为Flash Developer和SEOer之间的交集、沟通太少。一方面,Flash的ActionScript对于初级的SEOer来说门槛还是很高的,另一方面,Flash Developer本身也鲜有SEO的意识。我所认识的许多Flash Developer,尤其是偏Designer的朋友,都认为SEO是一个很没技术含量的“脏活”,他们根本不屑于了解任何关于SEO的知识。(我05年的时候和许多Flash开发者讨论SEO都被鄙视“没技术含量”了^_^)当然,我绝不责怪他们的傲慢,因为SEO这个行业由于其暴利性和入门门槛超级低,本身就是鱼龙混杂的。也许是大家都太功利,像点石这样的正规SEO博客太少了。

在Flash外面把Flash的内容套入一个隐蔽的div结点的做法已经有不少争论了,我也不再赘述了。我来说一下我利用ActionScript(SWF内部)对Flash进行SEO的一些经验。

首先,对于传统的ActionScript1-2,也就是跑在FlashPlayer8以前的版本的SWF来说,SEO只需要了解一行命令即可,那就是getURL:

用法是:

someButton.onRelease=
   function ()
   {getURL("http://www.awflasher.com/",
    "_blank")
   }

这里,someButton是某个按钮的实例名,getURL代表点击之后弹出到哪个URL,_blank代表在新窗口中打开(和href的target属性一样,不再赘述)。我想这行语句还是很容易明白的吧。在你的Flash相关的按钮中放置相应的getURL,链接到相关的页面,这个页面就能获得PR的“计分”。

对于ActionScript3,方式和ActionScript2类似,只不过ActionScript3中的flash.net包比较复杂,将getURL更加系统地分解成了几个部分,如下:

首先要引入一个包:

import flash.net.navigateToURL;

然后,在相应元件中调用这个flash.net包中所含有的方法 – navigateToURL

注意,传入的并不是一个简单的URL,而是一个URLRequest类实例(你也可以设置POST变量等更多内容进行提交)

var url:String = "http://www.adobe.com"; 
var request:URLRequest = new URLRequest(url); 
try {            
navigateToURL(request); 
} 
catch (e:Error) { 
// handle error here 
}

ActionScript3更加系统,也更复杂,如果是小型的Flash AS2项目需要尽快优化,采用最开头的简单方法就可以了。

当然,最关键的问题是,Google和Yahoo具体如何去解析一个SWF文件,具体如何判定PR的高低(毕竟SWF内没有HTML这样明晰的语义,如h1、h2、strong、em等标签)这仍然需要等待Google和Yahoo等搜索引擎最终发布的文档。