刘海涛主要贡献

计算机语言依存算法;刘海涛教授在这一方面的主要研究成果和贡献是:(1)《结构化语言知识库在自然语言处理中的应用》(1992),这可能是国内最早探讨句法标注语料库(树库)作为自然语言处理知识源的文章。(2)《自然语言处理中的媒介语问题》(1993),探讨了计算语言学和媒介语的关系,将媒介语纳入国际语学的研究范畴,提出了媒介语的重要性(经济型、工具性),从媒介语的类型分析中揭示其应满足的条件性(规则性、精确性、表达力)。(3)《维特根斯坦语言哲学对计算语义学的影响》(1993),旨在为基于统计和数据的计算语言学应用寻求哲学基础。(4)《计算语言学应用中的模块化概念》(1995)把计算语言学应用的开发和研制分为三个层面:理论语言学、计算语言学和计算机科学,这种分类有助于不同知识背景的人更好地融合到计算语言学应用的研究中来。(5)《依存语法和机器翻译》(1997),探讨了依存语法的一些基本问题,对依存语法在机器翻译领域的应用做了简要的介绍和论述。这篇文章目前是国内依存语法领域引用率最高的文献之一。(6)《关于自然语言计算机处理的几点思考》(2001),对语言和智能、语言是可以计算的吗?语义和分解、歧义与知识等计算语言学的基本问题进行了探讨。(7)《计算语言学课程设置和教学》(2005),介绍了中国传媒大学计算语言学相关课程的设置情况,认为大学和研究生计算语言学课程的设置应该重点关注语言学和计算机科学的交叉部分,即:语言的形式化问题。(8)《面向树库建设的汉语依存句法》(2006,英文),和《汉语依存树库的建设和应用》(2007,英文),提出了一种汉语依存句法,讨论了如何建设和使用汉语依存树库。(9)《自然语言处理的概率配价模式理论》(2007),提出了一种概率配价模式理论,这种理论更好地解释统计自然语言处理的一些问题,是对传统配价理论的扩充和发展。(10)《基于树库和机器学习的汉语依存语法句法分析》(2007),和《影响依存句法分析的因素探讨》(2007),分别探讨了如何通过修改树库标注体系来提高句法分析精度的方法以及影响依存句法分析精度的主要因素。(11)《依存距离的概率分布》(2007,英语)的研究表明,自然语言的依存距离符合右截尾Zeta分布,随机语言则没有这样的特征。在三种语言中,自然语言的平均依存距离是最小的。(12)《汉语句法网络的复杂性研究》(2008,英语),采用复杂网络分析技术研究了由“新闻联播”和“实话实说”构造的两个汉语句法网络,两个网络均为小世界和无尺度网络,但网络特征有较明显的差异,这项研究开辟了用复杂网络研究语言(体)的新路子。(13)《句法网络在语言网络中的作用》(2008,英语),通过比较两个随机生成网络和句法网络的复杂网络特征,研究了句法在语言网络中的作用。按照论文匿名评阅人的说法,这是一个生命科学(语言学和心理学)的重要论题。(14)《基于依存树库的汉语句法计量研究》(2008)指出:汉语的依存距离均值约为2.84,汉语中40%-50%的依存关系不是在相邻的词之间形成的;在语言类型方面,汉语是一种支配词置后略占优势的混合型语言,一种SV、VO和AdjN语言;汉语支配词居前的依存距离均值要明显大于支配词置后的依存距离均值。

更多相关

洪卫主要贡献洪卫主要贡献
刘庆龙主要贡献刘庆龙主要贡献
郑文堂主要贡献郑文堂主要贡献
王向明主要贡献王向明主要贡献
赵蓓主要贡献赵蓓主要贡献
伍保国主要贡献伍保国主要贡献
董霖主要贡献董霖主要贡献
郑强主要贡献郑强主要贡献
姚雷主要贡献姚雷主要贡献
于浩主要贡献于浩主要贡献
刘保成主要贡献刘保成主要贡献
戴小明主要贡献戴小明主要贡献
周泓主要贡献周泓主要贡献
黄光荣主要贡献黄光荣主要贡献
孙海鹰主要贡献孙海鹰主要贡献
宋戈主要贡献宋戈主要贡献
布里格斯主要贡献布里格斯主要贡献
塔拉索夫主要贡献塔拉索夫主要贡献
黄浩主要贡献黄浩主要贡献