专利号:CN201110196449.6
专利名称:一种基于实体的自底向上Web数据抽取方法
申请日:2011-07-13
专利类型:授权发明
支付方式:面议
支付标准:面议
所属分类:人工智能
项目详情:本发明提供了一种基于实体的自底向上Web数据抽取方法,属于网络数据管理领域,具体步骤包括:选择Web数据页面、划分文本、标注实体属性、抽取属性序列重复模式抽取、化简结果模式;本发明的Web数据抽取方法,可以更广泛的抽取复杂Web页面的结构化数据,有效避免先前抽取技术对页面结构的过度依赖,适应性好,准确度高。
联系人:张刚刚
电话:83671445
