Virtuoso是一个管理多类型的数据库系统,他支持RDF的存储同时也支持SPARQL的查询,并且在众多评测结果都名列前茅,在前一篇文章写了《Virtuoso 安装 – Ubuntu环境》,这篇会给出一个例子如何上传自己的RDF,同时进行Sparql的查询。
Category: 技术宅
Virtuoso 安装 – Ubuntu环境
OpenLink Virtuoso是下一代的通用服务器和业务管理器,它为新一代网络的开发和部署提供了遍历,能够将不同数据库和数据源的数据连接起来。在知识库领域,他支持RDF和SPARQL查询,他优越的性能得到了学术界的认同,大量的评测结果,它都名列前茅,属于开源软件中值得推荐的一款处理RDF的数据库系统。
Continue reading “Virtuoso 安装 – Ubuntu环境”
weather 的中国城市代码
天气信息是日常大众最常询问的信息之一,获取准确的天气信息对一件产品来说是至关重要的。可惜网络上免费开放的接口不多,目前,我主要找到的是国家气象局(www.weather.com.cn)和美国的一个气象频道(www.weather.com),不过两边给的数据都各有优劣。该问只是总结了一下我对他们数据的一些使用心得,已经重新整理了weather.com的城市代码供有需求的朋友使用。
国家气象局的数据,地理信息精确到城市,气象信息精确到当天和三天的预报,但是却没有更深一层的区域和区域天气数据。这样减低了用户体验,用户往往想知道他们所在的地方,这一刻或者马上的天气如何。
也正因此我寻思着找另外一种API提供精准的数据的,至少能够提供当前气候的。iPhone里用了www.weather.com的数据,在网上找了些资料,发现国内也有不少人在使用他们的数据,挖出他们网站的API以及网友整理的城市代码,测试了几个,发现有些地理信息的代码太旧了,所以索性自己重新制作了一份。最终,这份数据总共816个,与国家气象局2500多个比起来,确实比较少,另外,这份数据还有更新问题,比如上海的嘉定,在整理出的数据中,名字是南县。所以在使用的时候要验证一下,比如和国家气象局的进行一下对比。
点击下载:weatherCityCode
最近刚看到有一款产品通过卷积神经网络分析气象图来给特定的企业用户提供特别的天气服务,可以说是将天气用得很到位,另外,早上看到新闻报道说美国的牧民找到俄罗斯的最佳放牧环境,就因为气候相当。
使用数据请标明来源: @flykun.com, 谢谢
2015上海复旦大学知识图谱前沿技术研讨会
参加这次知识图谱的研讨会,最大的体会就是大家都一个劲的在Freebase上做工作,而汉语的知识库工作却少的可怜,这是因为国内没有一个开源的环境吗?
anyway,这次工业界、学术界都来了不少人,也为我在知识库效率的研究上敞开了一扇大门,有兴趣的可以去看看。
http://kw.fudan.edu.cn/workshop2015/
基于语义网的知识管理
蒂姆博纳斯李设计的互联网3.0时代将会随着语义网的深入建立而到来,最终实现语义搜索功能。
语义网结合本体构成的系统,具有扁平化的数据,多用户操作、数据的传递性、长期在线,推理的特性,提供了制作一个知识库的基础,对框架的深入探索,结合其他学者的工作,总结PPT里面的知识,设计知识库构建的几个主要方向。
安装、更新最新的Git – Ubuntu环境
这篇文章记录了,在Ubuntu 14.04服务器上更新Git遇到的问题,Git源更新,安装更新源的命令:apt-add-repository。
Continue reading “安装、更新最新的Git – Ubuntu环境”
法语论文中法文自动对齐
我的中法文自动对齐的论文
Kun JIN (2013) Alignement automatique des corpus bilingue français et chinois
什么是知识库,和其他数据库的区别?
知识库(Knowledge Base,简称“KB”)是一个通过计算机系统来存储复杂结构和非结构化信息的技术。该词最早出现在专家系统中,称为知识库系统。
知识库系统以知识库为基础的,该知识库包括了现实世界中的事实,同时一个推理引擎可以推理出这些事实,也可以使用一些规则或者其他逻辑演绎出新的事实或指出不符的事实。
知识库(Knowledge Base,简称“KB”)是一个通过计算机系统来存储复杂结构和非结构化信息的技术。该词最早出现在专家系统中,称为知识库系统。
知识库系统以知识库为基础的,该知识库包括了现实世界中的事实,同时一个推理引擎可以推理出这些事实,也可以使用一些规则或者其他逻辑演绎出新的事实或指出不符的事实。
RDF效率 的评测 – 翻阅资料
“RDF效率” 问题是在建立“知识库”(或者“语义网”)所遇到的一个主要问题,RDF的存储系统在市面上有很多,Jena, Virtuoso, Sesame, BigData, BigOWLIM等开源系统,AllegroGraph,Marklogic等商业系统,大公司Oracle的Spatial and Graph也开始支持RDF的查询。这么多的框架该如何选择,哪个系统最适合手头的项目,这变成了一个重要的问题。该文整理了查阅工作的一些资料和心得,免得以后做重复的工作。
“RDF效率” 的问题,是在建立“知识库”(或者“语义网”)所遇到的一个主要问题,RDF的存储系统在市面上有很多,Jena, Virtuoso, Sesame, BigData, BigOWLIM等开源系统,AllegroGraph,Marklogic等商业系统,大公司Oracle的Spatial and Graph也开始支持RDF的查询。这么多的框架该如何选择,哪个系统最适合手头的项目,这变成了一个重要的问题。该文整理了查阅工作的一些资料和心得,免得以后做重复的工作。
造就数据科学家(转)
我们意识到当企业不断发展,我们都需要弄明白如何称呼团队的成员。我们觉得大多数研究科学家从事的是比较创新和抽象的,我们组织的注意力集中在数据应用上,这些工作通常对于商业业务有着直接和巨大的影响。因此最最适合的称呼应该叫做“数据科学家”——那些使用数据和科学来创造新事物的人们。
结合自身的经历,从NLP开始,到在研究所做数据的TEI结构设计,再在欧盟DARIAH上介绍这个结构,以及目前手头在做的语义网,无一不是在和数据、结构打交道,始终困惑这应该属于什么类型的职位,看到这篇文章实在是帮我找到了一个位置,希望有相同困扰的朋友也看看。