别再搞纯文本了!多模文档理解更被时代需要!

别再搞纯文本了!多模文档理解更被时代需要! 7

知行编程网 人工智能前沿 2年前 (2022-02-01) 60 0

都已经2021年了,互联网已经今非昔比,20年前纯文本的日子已经一去不复返,文字已经满足不了网页、文章的需求,绝大部分都会有着精心设计的表格、图片,甚至视频。PDF文档这种富文本格式拥有更加复杂的结构信息,其流行程度已经远超TXT。大到工作报告,小到收银条,形形色色的文档充斥着各个角落,如何利用这些文档中丰富的信息呢?智能文档理解成为了许多大厂的关注要点。 ML模型做文档理解的第一步往往是OCR,...

扫一扫二维码分享