腾讯推出PDF识别神器:复杂文档解析准确率超98%

zhiyongz 阅读: 2024-06-21 19:35:00 评论:0

快科技6月21日消息,腾讯云大模型知识引擎新鲜出炉,它有一项新能力——大模型知识引擎文档解析!基于腾讯优图实验室自研新一代多模态文档解析大模型,它能先通过版面分析定位文档所有内容的位置和类型,再对文本表格公式等内容进行精准识别,最后按照我们人类的阅读顺序输出连贯可读的内容。

腾讯推出PDF识别神器:复杂文档解析准确率超98%

比如,面对带表的PDF文档,特别表格没有框的,它能通过融合行列关系特征和元素特征来预测表格的行列间隔线。

腾讯推出PDF识别神器:复杂文档解析准确率超98%

腾讯推出PDF识别神器:复杂文档解析准确率超98%

算法能推理并对表格数据和结构进行正确复原,极大提高识别准确率。每次复制表格都数据错位的人有福了!不仅中英文,它还支持20+语言,以及繁体字、生僻字等多种类字体。更惊喜的是,它还支持将识别后的图片、PDF文档转换为Markdown格式输出。腾讯表示,大模型知识引擎文档解析目前对复杂文档的解析准确率可达98%以上。

目前,这项文档解析功能已在多个产品上线,大家也可点此在线体验。


部分内容源于互联网,请仔细甄别真实性!如涉及关于钱的内容,更请谨慎对待!网址:https://tashuo.net/articles/32135.html

可以去百度分享获取分享代码输入这里。
声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

发表评论
搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容