据说是N年前南大小百合上的帖子,不过风格挺好的,转来仰慕下吧。不知牛人们现在干啥了都。 闲着无事,想写点一些我所了解的machine learning大家。由于学识浅薄,见识有限,并且仅局限于某些领域,一些在NLP及最近很热的生物信息领域活跃的学者我就浅陋无知,所以不对的地方大家仅当一笑。 Machine Learning 大家(1):M. I. Jordan 在我的眼里,M Jordan无疑是武林中的泰山北斗。他师出MIT,现在在berkeley坐镇一方,在附近的两所名校(加stanford)中都可以说无出其右者,stanford的Daphne Koller虽然也声名遐迩,但是和Jordan比还是有一段距离。
Archive for the ‘干活’ Category
[zz] wikiCFP
By clfour in 干活, 资讯在ICTExtr9的专栏上看到的,这个wiki在google alert里经常出现,这次又发现有人介绍,而且是做检索相关研究的,就直接copy过来了。在此感谢原搜集者,希望对大家有用! 1. 推荐一个查找近期会议的网站-wikicfp Wikicfp http://www.wikicfp.com/ 有很多人把各种会议的call for paper发到这个网站上。 可以管理自己关注的会议列表并按照多种方式排序,比如,按deadline排序 2. 相关会议列表 在wikicfp上维护了一个信息抽取相关会议的列表: http://www.wikicfp.com/cfp/servlet/event.showlist?lownerid=2907<ype=w&page=1&sortby=0
news digest
By clfour in 干活, 折腾, 资讯●Semantic Sense for the Desktop A project brings Semantic Web technology to personal documents. 这篇是对Nepomuk Project的介绍,讲了语义桌面的出发点,之前的研究,此项目的的一些特点和方法,最后的有给出下载链接,不过安装不是一步到位的,需要些前期步骤。感兴趣的可以下载试试。
Tags: IT, search, semantic search, Study
微软新搜索引擎—>kumo.com?
By clfour in 干活, 资讯Updated: 微软最新搜索引擎定名为:bing (查看) 几天前,某关注微软Live动向的独立网站的一篇文章,让许多对微软搜索引擎的传言也更加流行起来。文章指出微软在近期收购了一个新的域名kumo.com,并将它指向了live search的部分服务器,当前供员工内部测试使用。kumo在日语中是云或者蜘蛛的意思,在结合当前云计算的热潮以及微软之前的动向(上周四微软确认雅虎搜索执行官将成为微软硅谷搜索技术中心的总经理,收购语义检索公司Powerset),真的让人会有所期待了。live大张旗鼓进军google的地盘,没有撼动google的位置,现在微软在收购yahoo无期的情况下,动作拼出,看来势必在搜索上会有一番表现了。当然,微软官方对此次民间的传言保持沉默中ing 到底kumo.com会有何用我们还不能知,文章说在未来6-12个月内就会有明确答案了,语义?云计算?新的live search? ps:搞了个日语,估计某国又要举国欢腾了,不是说奥巴马竞选成功就有某市因为其名与未来美国总统发音类似而提前过了个年~ 当然,要是那天google改名yun.com我也很高兴 哈哈 其他相关连接: http://news.cnet.com/8301-10805_3-10106314-75.html http://www.guardian.co.uk/technology/blog/2008/nov/24/microsoft-live-kumo http://www.theregister.co.uk/2008/11/24/kumo_windows_live_search/ http://tinycomb.com/2008/11/23/kumo-microsofts-new-search-engine/ http://www.efluxmedia.com/news_Kumo_The_new_name_Of_Microsoft_Live_Search_29731.html
Tags: IT, kumo, ms, search, semantic search
google开始走向语义检索?(updated)
By clfour in 干活, 资讯最近几天没有关注Google Alert 的内容,今天一看,有这么一条消息:Google launches its SearchWiki semantics plug-in。前一段时间Semanti Corp. 发布消息,自己的语义检索插件SemantiFind支持yahoo, msn, google的搜索引擎。而微软买了Powerset(这个试了下没什么感觉,用过的评价下?)后,也有了语义检索引擎,ask也开始尝试语义的东西,而yahoo早在3月份就宣布进军语义网,看来当今检索大佬google也坐不住了,现在自己也加入了一些新变化。记得是一年之内的一次校园招聘里面(或者会议?),微软还是google的管理层被问到语义检索的时候,还是一脸的怀疑,并声称没有这方面的打算,可现在大家却都纷纷着手做了起来。语义,看来真的是下一个网络时代的潮流,真的会变成web3.0了,当前语义的效果确实不尽如人意,但是如果成功的话,影响将是不可忽视的。IBM,微软,google,不同时代的代表,下一个会是谁?大家争先恐后。 言归正传,说说google的SearchWiki,思想上借鉴了wiki的东西,允许用户对检索的结果进行提升,删除和评论,但是每个用户的改变只影响自己的检索结果,不过可以看到大家对检索结果的编辑情况。其实,google当前的变化还很简单,算不上语义,只能算是个性化订制的一点扩展,感觉比SemantiFind还要简单,不过也算是对用户意图的改进了。刚刚在google上找了一下,也没看到这个插件,却发现了这样片文章:Google SearchWiki Vanishes (Updated),打开一看,写道google说这是因为有bug,正在恢复中。。。 更新:现在可以用了,不过要上http://www.google.com/并登陆账号才可以~ 我晕了 ,一会能用,一会不能用,估计测试中。。。 提供一个youtube上google对SearchWiki介绍的视频,感兴趣的可以了解下: 其他相关链接: http://www.betanews.com/article/Askcom_v_11_tries_new_search_technologies/1223316977 http://www.betanews.com/article/New_Google_tools_sift_and_sort_search_results/1225353991 http://news.bbc.co.uk/1/hi/technology/7296056.stm http://www.betanews.com/article/Semantic_search_plugin_comes_to_Google_Yahoo_MSN/1225720138 http://googleblog.blogspot.com/2008/11/searchwiki-make-search-your-own.html http://searchengineland.com/google-searchwiki-101-an-illustrated-guide-15580.php http://googlesystem.blogspot.com/2008/11/google-searchwiki-launched.html
Tags: google, IT, search, semantic search, Study
XP and ubuntu双系统默认启动
By clfour in 干活这个很久之前看过,不过很快就忘了具体是哪个文件了,这脑子。。。 电脑的情况:现状的XP,后来有通过硬盘安装的ubuntu,用的是grup,现在在c盘根目录还有这些文件。在安装ubuntu之后,电脑默认的开机启动就是ubuntu系统了,这个时候如果像要更改默认设置,需要在ubuntu下运行以下语句: sudo gedit /boot/grub/menu.lst 对弹出的文档进行修改保存,在里面找到类似的语句:default 0,0是开机启动时默认的启动系统所在的行,从第0行开始,开机的时候煮一下xp是第几行(0开始),然后改过来保存重启。另外,附近还有一个delay之类的好像,那是修改默认的选择时间的(秒)。 注意:ubuntu升级后,会出现位置变化的情况,我的默认就成了mentest了。一看原来是xp所在的行变了。
ubuntu下lucene和nutch的配置
By clfour in 干活这篇是对上面配置的继续 1.安装lucene wget http://apache.mirror.phpchina.com/lucene/java/lucene-2.3.2.tar.gz 不是lucene-2.3.2-src.tar.gz哦,这个无lucene-demos-2.3.2.jar 在目录下: tar zxvf lucene-2.3.2.tar.gz mv lucene-2.3.2 /usr/share 查看解压文件里面的build.txt里面有lucene配置的的基本步骤,根据提示,ant是必须的,我们现在要把ant的安装补上(eclipse下有ant,如果在eclipse下调试的话好像不需要再安装了就。具体的不太清楚也) ##CONTINUE## 2.安装ant http://ant.apache.org/bindownload.cgi ant是一个基于JAVA的自动化脚本引擎,脚本格式为XML。除了做JAVA编译相关任务外,ANT还可以通过插件实现很多应用的调用,比make脚本来说还要好维护一些。 wget http://apache.mirror.phpchina.com/ant/binaries/apache-ant-1.7.1-bin.tar.gz 在对应目录下: tar zxvf apache-ant-1.7.1-bin.tar.gz mv apache-ant-1.7.0 /usr/share/ gedit /etc/profile 加上 ANT_HOME=/usr/share/apache-ant-1.7.1 export ANT_HOME 编辑 PATH=$PATH:$JAVA_HOME/bin:$ANT_HOME/bin 3 继续设置lucene 再修改profile gedit /etc/profile 增加 LUCENE_HOME=/usr/share/lucene-2.3.2 CLASSPATH=.:${JAVA_HOME}/lib/dt.jar:${JAVA_HOME}/lib/tools.jar:${LUCENE_HOME}/lucene-core-2.3.2.jar:${LUCENE_HOME}/lucene-demos-2.3.2.jar 4.测试lucene demo 在lucene目录下, cd ./src/demo java org.apache.lucene.demo.IndexFiles /usr/share/lucene-2.3.2/docs 如果路径正确会出现如下: 。 。 。 adding [...]
ubuntu下jdk+eclipse+tomcat的配置
By clfour in 干活前几天把ubuntu下的一些工具配置了一下,真的是够费事的,现在写写具体的过程,给自己做个参照 ,也希望能给有需要的提供下信息吧。目前,我把开发环境搭建如下:ubuntu8.04 +jdk1.6.0_06 +Eclipse3.2.2 +Tomcat6.0.18 +Lucene2.3.2 +Nutch0.9,不过昨天把ubuntu升级了一下,现在发现jdk已经升级到1.6.0_07了,现在不知道会不会有影响。。。 现说说jdk,eclipse,tomcat的配置情况吧。基本上是参考这两篇:[原创]Ubuntu 7.10 J2EE开发环境lomboz+eclipse3.2.1+tomcat5.5.25+mysql5.ubuntu 8.04 J2EE 开发环境 eclipse 3.4汉化+tomcat+mysql+oracle+三大框架 ##CONTINUE## //***************************************// 1. jdk 首先安装JDK,sudo apt-get install sun-java6-jre sun-java6-jdk sun-java6-demo sun-java6-doc sun-java6-source sun-java6-plugin sun-java6-fonts libmyodbc tdsodb 此将JAVA环境安装全,包括实例和API文档,需要说明的是API文档需要另下载,照提示把API文档放到/tmp目录下,需要提醒的是,在安装过程会有一个确定,按TAB键,选择确定 (doc去官网上下就可以了) 下面是关键的步骤: 环境变量的设置: sudo gedit /etc/profile //这个配制文件就是一个纯文本的东西,用什么工具自己选择vi、vim、gvim、emacs什么的都可以,只要是你机器里有的文本编辑工具就可以 JAVA_HOME=/usr/lib/jvm/java-6-sun CLASSPATH=.:/usr/lib/jvm/java-6-sun/lib JRE_HOME=/usr/lib/jvm/java-6-sun/jre export JRE_HOME export CLASSPATH export JAVA_HOME 要特别注意位置是文章未尾umask 022之前 sudo gedit /etc/environment JAVA_HOME=/usr/lib/jvm/java-6-sun CLASSPATH=.:/usr/lib/jvm/java-6-sun/lib [...]