InkSight 是由 Google Research 于 2024 年推出的一款革命性的人工智能技术,它专门用于手写文字的识别和数字化。这项技术的核心优势在于其独特的学习方法,它通过模仿人类阅读和学习的过程,不断地重写和学习手写文本,从而积累对文字外观和含义的理解。与传统的光学字符识别(OCR)技术相比,InkSight 在处理复杂背景、模糊不清或低光照条件下的手写文字时,展现出了更高的识别准确率。
教程链接:https://go.openbayes.com/u78r3
使用云平台:OpenBayes
http://openbayes.com/console/signup?r=sony_0m6v
登录 OpenBayes.com,在「公共教程」页面,选择「Inksight 将手写文字数字化 Demo」教程。
页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。
选择「NVIDIA RTX 4090」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。可以使用文章开头的邀请链接,获得 RTX 4090 使用时长!
稍等片刻,待系统分配好资源,当状态变为「运行中」后,点击「API 地址」边上的跳转箭头,即可跳转至 Demo 页面。
1. 单词转写(Word-level inference)
点击「Word-level inference」,上传一张单个单词的手写体,然后点击「ink」渲染。
2. 整页转写(Full page inference)
点击「Full page inference」,上传整页的手写体,然后点击「ink」渲染。