日志分类:干活

[ZZ]机器学习(Machine Learning)大家

2009-04-03,星期五 | 分类:FunFun, 干活 | 标签: | 329

据说是N年前南大小百合上的帖子,不过风格挺好的,转来仰慕下吧。不知牛人们现在干啥了都。

闲着无事,想写点一些我所了解的machine learning大家。由于学识浅薄,见识有限,并且仅局限于某些领域,一些在NLP及最近很热的生物信息领域活跃的学者我就浅陋无知,所以不对的地方大家仅当一笑。

Machine Learning 大家(1):M. I. Jordan

在我的眼里,M Jordan无疑是武林中的泰山北斗。他师出MIT,现在在berkeley坐镇一方,在附近的两所名校(加stanford)中都可以说无出其右者,stanford的Daphne Koller虽然也声名遐迩,但是和Jordan比还是有一段距离。

全文阅读 »

[zz] wikiCFP

2009-02-23,星期一 | 分类:干活, 资讯 | 标签: | 394

ICTExtr9的专栏上看到的,这个wiki在google alert里经常出现,这次又发现有人介绍,而且是做检索相关研究的,就直接copy过来了。在此感谢原搜集者,希望对大家有用!

1. 推荐一个查找近期会议的网站-wikicfp
Wikicfp

http://www.wikicfp.com/

有很多人把各种会议的call for paper发到这个网站上。
可以管理自己关注的会议列表并按照多种方式排序,比如,按deadline排序

2. 相关会议列表
在wikicfp上维护了一个信息抽取相关会议的列表:

http://www.wikicfp.com/cfp/servlet/event.showlist?lownerid=2907<ype=w&page=1&sortby=0

全文阅读 »

[ZZ]哈工大中文信息处理人物谱

2009-01-13,星期二 | 分类:干活, 资讯 | 标签: | 480

zz from here,根据第一位前辈的年龄,这篇应该是06年的数据 了,以备参考

王开铸教授,1932年出生,74岁,80年代从事俄汉机器翻译、固定段落理解与问答系统的研究,90年代开始进行自动文摘、自动校对的研究。曾任哈工大计算机系系主任8年,已退休多年。

全文阅读 »

国内搜索相关的实验室+news digest

2008-12-29,星期一 | 分类:干活 | 标签: | 472

news digest

2008-12-20,星期六 | 分类:干活, 折腾, 资讯 | 标签: | 386

Semantic Sense for the Desktop
A project brings Semantic Web technology to personal documents.

这篇是对Nepomuk Project的介绍,讲了语义桌面的出发点,之前的研究,此项目的的一些特点和方法,最后的有给出下载链接,不过安装不是一步到位的,需要些前期步骤。感兴趣的可以下载试试。
全文阅读 »

微软新搜索引擎—>kumo.com?

2008-11-24,星期一 | 分类:干活, 资讯 | 标签: | 1,445

Updated: 微软最新搜索引擎定名为:bing (查看)

bing

几天前,某关注微软Live动向的独立网站的一篇文章,让许多对微软搜索引擎的传言也更加流行起来。文章指出微软在近期收购了一个新的域名kumo.com,并将它指向了live search的部分服务器,当前供员工内部测试使用。kumo在日语中是云或者蜘蛛的意思,在结合当前云计算的热潮以及微软之前的动向(上周四微软确认雅虎搜索执行官将成为微软硅谷搜索技术中心的总经理,收购语义检索公司Powerset),真的让人会有所期待了。live大张旗鼓进军google的地盘,没有撼动google的位置,现在微软在收购yahoo无期的情况下,动作拼出,看来势必在搜索上会有一番表现了。当然,微软官方对此次民间的传言保持沉默中ing

到底kumo.com会有何用我们还不能知,文章说在未来6-12个月内就会有明确答案了,语义?云计算?新的live search?

ps:搞了个日语,估计某国又要举国欢腾了,不是说奥巴马竞选成功就有某市因为其名与未来美国总统发音类似而提前过了个年~ 当然,要是那天google改名yun.com我也很高兴 哈哈

其他相关连接:

http://news.cnet.com/8301-10805_3-10106314-75.html

http://www.guardian.co.uk/technology/blog/2008/nov/24/microsoft-live-kumo

http://www.theregister.co.uk/2008/11/24/kumo_windows_live_search/

http://tinycomb.com/2008/11/23/kumo-microsofts-new-search-engine/

http://www.efluxmedia.com/news_Kumo_The_new_name_Of_Microsoft_Live_Search_29731.html

google开始走向语义检索?(updated)

2008-11-23,星期天 | 分类:干活, 资讯 | 标签: | 703

 

最近几天没有关注Google Alert 的内容,今天一看,有这么一条消息:Google launches its SearchWiki semantics plug-in。前一段时间Semanti Corp. 发布消息,自己的语义检索插件SemantiFind支持yahoo, msn, google的搜索引擎。而微软买了Powerset(这个试了下没什么感觉,用过的评价下?)后,也有了语义检索引擎,ask也开始尝试语义的东西,而yahoo早在3月份就宣布进军语义网,看来当今检索大佬google也坐不住了,现在自己也加入了一些新变化。记得是一年之内的一次校园招聘里面(或者会议?),微软还是google的管理层被问到语义检索的时候,还是一脸的怀疑,并声称没有这方面的打算,可现在大家却都纷纷着手做了起来。语义,看来真的是下一个网络时代的潮流,真的会变成web3.0了,当前语义的效果确实不尽如人意,但是如果成功的话,影响将是不可忽视的。IBM,微软,google,不同时代的代表,下一个会是谁?大家争先恐后。

言归正传,说说google的SearchWiki,思想上借鉴了wiki的东西,允许用户对检索的结果进行提升,删除和评论,但是每个用户的改变只影响自己的检索结果,不过可以看到大家对检索结果的编辑情况。其实,google当前的变化还很简单,算不上语义,只能算是个性化订制的一点扩展,感觉比SemantiFind还要简单,不过也算是对用户意图的改进了。刚刚在google上找了一下,也没看到这个插件,却发现了这样片文章:Google SearchWiki Vanishes (Updated),打开一看,写道google说这是因为有bug,正在恢复中。。。  更新:现在可以用了,不过要上http://www.google.com/并登陆账号才可以~   我晕了 :eek: ,一会能用,一会不能用,估计测试中。。。

提供一个youtube上google对SearchWiki介绍的视频,感兴趣的可以了解下:

其他相关链接:

http://www.betanews.com/article/Askcom_v_11_tries_new_search_technologies/1223316977
http://www.betanews.com/article/New_Google_tools_sift_and_sort_search_results/1225353991
http://news.bbc.co.uk/1/hi/technology/7296056.stm
http://www.betanews.com/article/Semantic_search_plugin_comes_to_Google_Yahoo_MSN/1225720138
http://googleblog.blogspot.com/2008/11/searchwiki-make-search-your-own.html
http://searchengineland.com/google-searchwiki-101-an-illustrated-guide-15580.php
http://googlesystem.blogspot.com/2008/11/google-searchwiki-launched.html

XP and ubuntu双系统默认启动

2008-10-05,星期天 | 分类:干活 | 标签: | 310

这个很久之前看过,不过很快就忘了具体是哪个文件了,这脑子。。。
电脑的情况:现状的XP,后来有通过硬盘安装的ubuntu,用的是grup,现在在c盘根目录还有这些文件。在安装ubuntu之后,电脑默认的开机启动就是ubuntu系统了,这个时候如果像要更改默认设置,需要在ubuntu下运行以下语句:
sudo gedit /boot/grub/menu.lst
对弹出的文档进行修改保存,在里面找到类似的语句:default 0,0是开机启动时默认的启动系统所在的行,从第0行开始,开机的时候煮一下xp是第几行(0开始),然后改过来保存重启。另外,附近还有一个delay之类的好像,那是修改默认的选择时间的(秒)。
注意:ubuntu升级后,会出现位置变化的情况,我的默认就成了mentest了。一看原来是xp所在的行变了。

ubuntu下lucene和nutch的配置

2008-10-01,星期三 | 分类:干活 | 标签: | 395

这篇是对上面配置的继续
1.安装lucene
wget http://apache.mirror.phpchina.com/lucene/java/lucene-2.3.2.tar.gz
不是lucene-2.3.2-src.tar.gz哦,这个无lucene-demos-2.3.2.jar
在目录下:
tar zxvf lucene-2.3.2.tar.gz
mv lucene-2.3.2 /usr/share

查看解压文件里面的build.txt里面有lucene配置的的基本步骤,根据提示,ant是必须的,我们现在要把ant的安装补上(eclipse下有ant,如果在eclipse下调试的话好像不需要再安装了就。具体的不太清楚也)
##CONTINUE##
2.安装ant

http://ant.apache.org/bindownload.cgi

ant是一个基于JAVA的自动化脚本引擎,脚本格式为XML。除了做JAVA编译相关任务外,ANT还可以通过插件实现很多应用的调用,比make脚本来说还要好维护一些。

wget http://apache.mirror.phpchina.com/ant/binaries/apache-ant-1.7.1-bin.tar.gz

在对应目录下:
tar zxvf apache-ant-1.7.1-bin.tar.gz

mv apache-ant-1.7.0 /usr/share/

gedit /etc/profile

加上
ANT_HOME=/usr/share/apache-ant-1.7.1
export ANT_HOME
编辑
PATH=$PATH:$JAVA_HOME/bin:$ANT_HOME/bin

3 继续设置lucene
再修改profile
gedit /etc/profile
增加
LUCENE_HOME=/usr/share/lucene-2.3.2
CLASSPATH=.:${JAVA_HOME}/lib/dt.jar:${JAVA_HOME}/lib/tools.jar:${LUCENE_HOME}/lucene-core-2.3.2.jar:${LUCENE_HOME}/lucene-demos-2.3.2.jar

4.测试lucene demo
在lucene目录下,
cd ./src/demo
java org.apache.lucene.demo.IndexFiles /usr/share/lucene-2.3.2/docs

如果路径正确会出现如下:



adding /usr/share/lucene-2.3.2/docs/demo.pdf
adding /usr/share/lucene-2.3.2/docs/demo2.html
adding /usr/share/lucene-2.3.2/docs/gettingstarted.html
adding /usr/share/lucene-2.3.2/docs/fileformats.pdf
adding /usr/share/lucene-2.3.2/docs/scoring.html
adding /usr/share/lucene-2.3.2/docs/linkmap.html
adding /usr/share/lucene-2.3.2/docs/lucene-sandbox/index.html
adding /usr/share/lucene-2.3.2/docs/lucene-sandbox/index.pdf
adding /usr/share/lucene-2.3.2/docs/queryparsersyntax.pdf
adding /usr/share/lucene-2.3.2/docs/linkmap.pdf
adding /usr/share/lucene-2.3.2/docs/demo4.html
adding /usr/share/lucene-2.3.2/docs/benchmarktemplate.xml
adding /usr/share/lucene-2.3.2/docs/index.pdf
Optimizing…
17869 total milliseconds
并生成index文件夹。
然后就可以搜索了,
输入以下命令就会出现搜索提示符。
java org.apache.lucene.demo.SearchFiles
按提示输入即可。

如果要在tomcat下测试lucene demo可按如下操作:
4.1.将lucene目录下的/src/jsp目录复制到tomcat的webapps目录下,该名为luceneweb
4.2.复制lucene-core-2.3.2.jar和lucene-demos-2.3.2.jar到luceneweb/WEB_INF/lib目录下(或将luceneweb.war复制到tomcat的webapps目录下)没仔细试,好像不行

4.3.将index目录复制到luceneweb目录下
4.4.编辑luceneweb下的configuration.jsp,设置String indexLocation = “/usr/share/tomcat6/webapps/luceneweb/index”;String appfooter也可以自行设置
4.5.重启tomcat,访问http://localhost:8080/luceneweb/,就可以看到lucene demo的界面了,可以试着搜索下看看~

5.安装Nutch
可以去Apache的官方网页http://www.apache.org/dyn/closer.cgi/lucene/nutch/ 下载最新版的Nutch,目前最新版是nutch-0.9
解压缩到目标文件夹即可。
Nutch和tomcat,eclipse的是接下来要做的工作了

ubuntu下jdk+eclipse+tomcat的配置

2008-10-01,星期三 | 分类:干活 | 标签: | 187

前几天把ubuntu下的一些工具配置了一下,真的是够费事的,现在写写具体的过程,给自己做个参照 ,也希望能给有需要的提供下信息吧。目前,我把开发环境搭建如下:ubuntu8.04 +jdk1.6.0_06 +Eclipse3.2.2 +Tomcat6.0.18 +Lucene2.3.2 +Nutch0.9,不过昨天把ubuntu升级了一下,现在发现jdk已经升级到1.6.0_07了,现在不知道会不会有影响。。。
现说说jdk,eclipse,tomcat的配置情况吧。基本上是参考这两篇:[原创]Ubuntu 7.10 J2EE开发环境lomboz+eclipse3.2.1+tomcat5.5.25+mysql5.ubuntu 8.04 J2EE 开发环境 eclipse 3.4汉化+tomcat+mysql+oracle+三大框架
##CONTINUE##
//***************************************//
1. jdk
首先安装JDK,sudo apt-get install sun-java6-jre sun-java6-jdk sun-java6-demo sun-java6-doc sun-java6-source sun-java6-plugin sun-java6-fonts libmyodbc tdsodb
此将JAVA环境安装全,包括实例和API文档,需要说明的是API文档需要另下载,照提示把API文档放到/tmp目录下,需要提醒的是,在安装过程会有一个确定,按TAB键,选择确定 (doc去官网上下就可以了)
下面是关键的步骤:

环境变量的设置:
sudo gedit /etc/profile //这个配制文件就是一个纯文本的东西,用什么工具自己选择vi、vim、gvim、emacs什么的都可以,只要是你机器里有的文本编辑工具就可以
JAVA_HOME=/usr/lib/jvm/java-6-sun
CLASSPATH=.:/usr/lib/jvm/java-6-sun/lib
JRE_HOME=/usr/lib/jvm/java-6-sun/jre
export JRE_HOME
export CLASSPATH
export JAVA_HOME
要特别注意位置是文章未尾umask 022之前

sudo gedit /etc/environment
JAVA_HOME=/usr/lib/jvm/java-6-sun
CLASSPATH=.:/usr/lib/jvm/java-6-sun/lib
提示:如果要让它立刻生效可以在终端里输入: . /etc/environment
一般情况可以不做设置,因为在这些安装完成后,机器必须得重启下,所没必要设置,但如果只是设置一下
环境变量就要用它的话,就可以采用这种方法。

sudo gedit /etc/jvm
在文件顶部添加
/usr/lib/jvm/java-6-sun
提示:这一步是在设置JDK的优先级

sudo gedit ~/.bashrc
在文件的末尾,添加如下两行
export JAVA_HOME=/usr/lib/jvm/java-6-sun
export PATH=$PATH:$JAVA_HOME/bin
提示:这是在设置用户变量

如果您的机器里装着多个JDK用下面的方法来选择JDK版本(8.04默认是没有安装JDK的,上面的安装只安装了一个版本的JDK,可以不设置)
sudo update-alternatives –config java

更新当前系统的JDK版本
sudo update-java-alternatives -s java-6-sun

clfour:因为ubuntu刚装的时候已经配置了一些,所以第一步相对简单了许多,只是又去下了一下文档。
//***************************************//
2.eclipse的安装:
eclipse的安装,您可以自己选择,可以用ubuntu提供的版本,也可以自己到eclipse官方网站下载
sudo atp-get install eclipse //ubuntu提供的版本
http://www.eclipse.org 自行下载的版本(当前是3.4)

sudo atp-get install eclipse
设置eclipse
sudo gedit /etc/eclipse/java_home
在文件顶部添加
/usr/lib/jvm/java-6-sun
这样eclipse就可以找到jre环境了

clfour:eclipse之前也已经装过了,是ubuntu提供的3.2版本,也没有在换。

//***************************************//
3.tomcat 安装:
到http://tomcat.apache.org/下载tomcat6.0.18,解压放到/usr/share/目录下。
到http://www.eclipsetotale.com/下载tomcat插件,解压放到eclipse目录下的plugins目录下,在eclipse就能看到小猫了

说明:下载的tomcat6.0.18也可以放到别的目录下,自己选择好了,我给/usr单独进行了分区,所以我的软件全装到了这个目录下,我将包改了名,叫tomcat6.0,您可以不改,
在下面的环境变量用您的包名就可以了

配置环境变量 :
sudo gedit /etc/profile
输入
CATALINA_HOME=/usr/share/tomcat6.0
export CATALINA_HOME

重启

运行 tomcat
运行 前先输入http://localhost:8080/
看看tomcat是否已经启动

进入tomcat的目录下面
sudo ./catalina.sh run

打开浏览器在地址栏里输入:http://localhost:8080/
看到那只小猫就OK了

关闭tomcat

//***************************************//
eclipse+tomcat
打开eclipse,windows-preferences-tomcat-选择version tomcat6.x,下面设置tomcat home 为tomcat所在目录,OK可以试试了
从eclipse的工具栏按钮中启动tomcat。
如果得到如下提示:
org.apache.catalina.startup.Catalina load
warning: Can’t load server.xml from /usr/share/tomcat6/conf/server.xml
查看$CATLINA_HOME/conf/server.xml,root用户具有读写权限,其他用户无任何权限,chmod o+r server.xml,添加读权限。

clfour:最后eclipse+tomcat,这一部分感觉还有点问题

Pages: 1 2 Next