傻鸵鸟的沙丘
该日志由 xm 发表于 2009-04-10
转自:http://www.cnbeta.com/articles/81343.htm
ps:已经提交注册申请,等待批准。期待人品,共1w个名额。
Google在周二宣布为他们的App Engine加入Java支持,Google App Engine 使您可以在支持 Google 应用程序的同一可扩展系统上构建网络应用程序。之前Google仅提供使用Python编写的程序,该语言虽然在Google内部很流行,但是在外面还未被广泛使用,所以Java支持成为Google App Engine 最急需的特性。
Google工程部门主管Graham Spencer在Campfire One活动上宣布,App Engine开始加入Java语言支持。另外Google还宣布了App Engine的其他特性,包括一个"cron"特性,允许用户安排特定的工作比如发送每周报告;还有一个安全数据连接器(Secure Data Connector)使得Google App Engine可以利用存储在公司防火墙背后的私密数据。另外还有一个全新的大规模数据导入工具,使得移动大量的数据到App Engine变得更加简单。
目前Java支持还处于测试模式,所以Google需要消除一些问题,比如与现有的Java软件开发工具和框架的兼容性问题。Google称,他们现在所发布的支持还尚不完整。
该日志标签: google, app engine
该日志由 xm 发表于 2009-03-06
从来不喜欢百度,因为它流氓。
喜欢谷歌,因为它不作恶。
百度一直号称最大的中文搜索引擎,我宁愿相信是谷歌的低调。
不过,今天的一次无聊的尝试,发现谷歌的蜘蛛似乎还不如百度啊。
无聊的尝试:在谷歌和百度分别搜索”傻鸵鸟的沙丘”。(本博客的名字)。此前均没有在两搜索引擎提交收录请求。
结果:谷歌无收录。百度在第一页发现。
希望谷歌能够更加强大。
已将本博客提交到谷歌。提示索引还需要一段时间。
ps:今天发现,雅虎表现更好啊。
原文网址:http://zhidao.baidu.com/question/47529878.html
Google和Baidu收录网站页面的标准是不同的。我用一句话来形容,就是Google更乐于收录大站的页面,百度则乐于收录新站的页面。
为此我做一个实验:先申请了一个新域名,在上面放一个网站,然后不在其他任何网站做链接,而直接往百度和Google搜索引擎的提交页面进行提交。一个月过去了,百度收录的网页是24,900篇,Google收录的网页是0,这证实了我以前的猜测。
这说明了什么呢?说明百度比Google好吗?绝对不是的。因为Baidu和Google收录页面的标准是完全不同的。
Google是按照网页级别(PageRank)来收录的,只要网站有一定的网页级别,Google会快速收录的,而没有网页级别的网站,Google 则坚决不去收录。Baidu则很夸张,采用的是来者不拒,多多益善的原则,无休止的进行收录。Baidu的这种不按网页级别的收录方式其实有很大的恶果, 最主要的恶果是造成大量的垃圾网站流行,因为只要做一个垃圾站,Baidu就会立刻收录(25000页以内),这等于变相的鼓励大家去做垃圾站,去盲目采 集。当垃圾站横行的时候,Baidu再通过人工的方式封站,甚至一些百度业务员对于大流量的网站还会要求其站长办理百度竞价排名。
这两 种收录方式哪种更好呢?我个人认为Google的这种收录方式是比较科学的。因为互联网上的页面是个天文数字,收录应该是有选择的收录,好的网站则多收 录,新站则应该少收录,等其慢慢知名了以后再多收录,这样也提高了效率,让用户搜索到更好的页面而不是更多的页面。如果对于新站不做分析就快速收录,那么 会使得从技术上对抗恶意网站作弊(SEO)变得非常困难,Google通过给予新站给出一定的“考察期”来分析这个新站是否是作弊的垃圾站,而百度就只能 依靠人工方式手动地删除垃圾站。对于收录网站的具体操作上,Google的爬虫显得较为“体贴”站长-Google爬虫占用服务器的资源非常少,通常是先 用head来查看网页是否更新,如果更新了再抓取整个页面,这种方法耗费流量较少。而百度则不管三七二十一上来就抓整个站,有时甚至不遵守robots规 则,而且其爬虫数量非常庞大,对于页面较多的网站通常会耗费惊人的流量,并且常常造成恶劣的后果。
当然,百度这种“贪婪”爬虫 抓取方 法,虽然会让用户能够在百度搜索出一些Google里搜索不到的页面,但这实在是损人利己。其带给网站站长不少负面效果:服务器和带宽资源过度消耗,垃圾 站被变相鼓励了,原创的有特色的网站则被边缘化,MP3音乐网站则更苦不堪言-自己的MP3被百度盗链后带来大量文件下载却没有带来页面访问。
因此,中国的网民也出现了很奇怪的现象:大量的新网民和菜鸟新手喜欢用百度搜索,因为百度往往搜索到很多别处搜索不到的页面,但内容的匹配度则令人质 疑,而专业人士和老鸟则更喜欢用Google,个人站长则普遍和百度有“个人恩怨”。因此百度在业界的Blog以及社区中口碑都不太好,但在普通的低层次 的网民心中却不错,这些大量的普通网民给百度带来了大量流量.
该日志标签: google