CN201110196449.6 一种基于实体的自底向上Web数据抽取方法

发布者:张永姣发布时间:2024-07-12浏览次数:11

专利号:CN201110196449.6

专利名称:一种基于实体的自底向上Web数据抽取方法

申请日:2011-07-13

专利类型:授权发明

支付方式:面议

支付标准:面议

所属分类:人工智能

  

项目详情:本发明提供了一种基于实体的自底向上Web数据抽取方法,属于网络数据管理领域,具体步骤包括:选择Web数据页面、划分文本、标注实体属性、抽取属性序列重复模式抽取、化简结果模式;本发明的Web数据抽取方法,可以更广泛的抽取复杂Web页面的结构化数据,有效避免先前抽取技术对页面结构的过度依赖,适应性好,准确度高。

  

联系人:张刚刚

电话:83671445

邮箱:dbdxzscq@mail.neu.edu.cn