(全球TMT2023年12月15日讯)澳鹏Appen全新推出文档智能识别接口,可将图片、不可编辑的PDF等文档一键识别转换成可编辑的Word或Markdown格式,方便对其中数据作进一步利用。接口支持识别文档中不同模态的数据,如文本、插图、公式、表格等,并支持对不同版面进行识别和还原。 澳鹏一站式文档智能识别解决方案集成了多种算法能力:首先使用版面识别算法,可识别出PDF中每一页的内容类型,包括文本、表格、公式、插图…
(全球TMT2023年12月15日讯)澳鹏Appen全新推出文档智能识别接口,可将图片、不可编辑的PDF等文档一键识别转换成可编辑的Word或Markdown格式,方便对其中数据作进一步利用。接口支持识别文档中不同模态的数据,如文本、插图、公式、表格等,并支持对不同版面进行识别和还原。
澳鹏一站式文档智能识别解决方案集成了多种算法能力:首先使用版面识别算法,可识别出PDF中每一页的内容类型,包括文本、表格、公式、插图等;如页面中包含多种内容,则将每个独立的内容块截取出来;再根据内容块的内容类型,调用不同的识别算法,包括文本识别算法、表格识别算法、公式识别算法等。识别完成后再将内容拼接到一个文档中,可还原成原始版面。同时,澳鹏也提供人工复核服务,进一步提升识别准确率。使用澳鹏文档智能识别处理文档时,一个上百页的PDF只需耗时数分钟即可完成。
如需转载请标明来源,内容与数据仅供参考,不构成投资建议。发布者:全球君,转转请注明出处:https://www.bigcompany.info/news/6105.html