明敏 萧箫 发自 凹非寺量子位 报道丨公众号 QbitAI
终于,我小学时的梦想有人实现了!
只需要我拍下自己的笔迹,AI就能帮我誊抄英语作业,画风“完全一致”的那种:
甚至帮别人抄作业也没问题……
简直吊打一批只能仿手写、价格还动辄几百上千的“作业神器”。
咳咳,
虽然功能很强大,但这可不是给你们抄英语作业的。(作业就得认真做!)
这是
不仅能移花接木,凭空将“酱油瓶”变成“茶壶”:
还能直接实现风格替换 ,让蔬果店里的所有印刷字都变成手写体:
这样看来,现在就连照片文字,也不一定是真实的了。
在实际使用过程中,TextStyleBrush真的就是个格式刷 ,哪里需要刷哪里。
它真正厉害的就是模拟手写字体。
只需输入一段文本内容,加上你的笔迹,1个单词即可,它就能生成“手写版”。
这个效果,用肉眼看真的是分辨不出真伪!
把菜场中价签的印刷体都换成手写体的过程中,它还能识别出不是印刷体的样本,自动跳过转换合成。
模拟特定字体格式时,TextStyleBrush表现也很不错。
包括海报、垃圾桶、路牌、饮料瓶、店面装饰……各种文字的风格都能handle:
除了直观的效果,开发人员对合成图片也做了数据上的分析。
TextStyleBrush生成的图片在合成误差(MSE)上大幅降低,峰值信噪比(PSNR)和结构相似性(SSIM)也提高不少。
在文字识别的准确性上,TextStyleBrush在三组数据集中的表现都不错:
准确率都高达95% 以上。
据Facebook介绍,“文字风格刷”TextStyleBrush是一个基于自监督 方法训练的模型,可以对相同文本内容的文字进行风格转换,就像格式刷一样。
当然,不只是Word的格式刷,它甚至能直接对照片中的文字进行替换,因此模型还需要学习文字识别 和图像分割 的方法。
为了同时实现图像分割和文字风格转换,TextStyleBrush模型基于StyleGAN2 进行了设计,后者能生成非常逼真的图像照片。
然而,StyleGAN2存在两个问题:
首先,它生成图像的方式是“随便乱打”的,也就是没办法控制输出图像特征。但TextStyleBrush必须要生成指定文本 的图像。其次,StyleGAN2的整体风格不受控制 ,但TextStyleBrush中的风格涉及大量信息组合,包括颜色、尺度和风格转换等特征,甚至是带有个人特色的笔迹细节差异。为此,TextStyleBrush首先通过将文本信息和风格作为两个“附加条件”控制模型输出,来解决模型随机生成图像的问题。
然后,为了进一步更精细地控制文本的风格特征,还会提取神经网络层中的各种风格信息,并将这些信息注入文本生成器中,便于从各种尺度(颜色、整体风格、细节)上控制文字的风格。
除此之外,由于不同的图片分辨率不同,生成器还必须生成和替换区域分辨率相似的文字。
为此,这一模型加入了能够控制高低分辨率的结构,使得生成的文字图像能匹配输入图像的分辨率。
就像这样,替换前后也不会出现字体清晰度差异大的问题:
但不同于照片,文字的风格其实要更加自由 ,所以有时候画风的真实性不好说。
为此,在训练的时候,Facebook引入了一种创新的自监督训练方法,结合风格分类、文本识别(OCR)和GAN三种模型来保留输入的风格/文字内容,再决定要替换哪个。
例如,在文本识别上,让TextStyleBrush生成文本图像后,模型会用一个预训练文本识别结构来“判断”图像的文字内容,并给它打分。
事实证明,这样训练出来的模型,确实很好用。
合成人脸已经玩太多了,合成笔迹还是头一回。
而且它的效果真的还不错!
所以,TextStyleBrush一经发布,就引来了很多人的围观。
已经有网友开始想象它的用途了:
欢迎来到花式签名 的世界!
LeCun 也转发了一波。
不过,能看不能玩实在是太难受了,有手痒的网友就跑来提问:
TextStyleBrush会对大众开放使用吗?
这自然也就引出来一个会引起争议 的点:
合成后的笔迹足以以假乱真,如果被滥用或恶意使用怎么办?
假设任何一个人的笔迹都能被非常轻松地合成,那许多需要签字的场合该怎么办呢?
例如,有网友表示,要是连医生 们的“草书”处方都能模仿……
而除了安全隐私问题上的担忧,这对字体设计师 来说也不是个好消息。
毕竟各款字体其实都是有版权的,如果可以被轻松模拟出来,那岂不是盗版 满天飞,甚至连作者本尊都分辨不出来真伪。
有网友就表示:这离真假难辨的反乌托邦世界更近了一点……
对此,Facebook的CTO作出了回应:
因为可能会被用来伪造笔迹,所以我们只发布论文和数据集,源代码并不会开源 。
分享研究和数据集,也更多是为了预防文本版Deepfakes。
你觉得呢?
TextStyleBrush数据集:https://github.com/facebookresearch/IMGUR5K-Handwriting-Dataset
论文地址:https://scontent-fml2-1.xx.fbcdn.net/v/t39.8562-6/10000000_944085403038430_3779849959048683283_n.pdf
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
手写模拟器 是一款非常有趣且好用的书法字体生成软件,可在下载银行搜索获得,它能够将任意文本自动生成为手写效果的图片。用户只需导入文件就可以通过预览窗口来查看最终效果,同时这里还有多个手写字体可以选择并预览。此外软件也提供了多个拟真背景,并且还能对生成的文字信息进行多项随机性的调整,使其看起来更加自然,用户也可以自己导入字体和背景来自定义最终的效果。
地址栏:包含【选择文件】【保存路径】【选择背景】和【选择字体】,均为选择系统目录或文件。
【选择文件】:即选择要模拟手写的文字内容,目前支持doc,docx和txt格式文件的读取
【保存路径】:即要导出时保存的路径
【选择背景】:选择纸张背景,支持JPG/jpg/png格式。注意纸张背景最好垂直拍摄从而避免透视导致的问题
【选择字体】:自定义字体
参数栏:负责手写字的参数设置。默然参数为默认背景下较为合适的参数。若选择默认背景,不需要进行过多的调节。
【字体】:选择内置字体,也可在地址栏中自定义字体
【背景】:选择内置背景,也可在地址栏中自定义背景
【普通值】:大小即手写字的大小。间距值,包括文字距上下左右边框的距离、字与字的距离、行与行之间的距离。
【扰动值】:在【0到设置值】之间选取随机值增加到固定参数值。若字间距为2,字间距扰动为2,则每个字间距会在【2到4】之间随机选择。
【预览】:预览的字数,默认值为500。请不要设置过多避免预览时间过长并最终只会预览出第一页。预览得到的图片会保存在保存路径内,并显示在【预览栏】中。
【其他参数】:抗锯齿、滤镜(目前还不支持)。
预览与导出:负责预览和导出手写图片。
【预览】:在设置好路径文件,以及相关参数后,可手动点击预览,在【预览栏】内查看第一页效果,不支持实时预览。在预览过程中请耐心等待。
【导出】:若效果满意或想直接查看全部图片,可点击导出,导出的文件为png图片格式,保存路径为地址栏中的【保存路径】。导出运算量可能较大,请耐心等待,导出完成时会有相关提示。
相关问答
经常使用华为手机,是不是还没用过以下的几种隐藏功能呢?带你一起来看看,华为手机有几个实用的隐藏功能,用过华为手机或者正在使用华为手机的你是否知道这几个...
制作手帐时,加入手写字是一种常见的方式来记录和表达个人想法、计划和笔记。下面是一些建议来在手帐中加入手写字:1.准备工具:选择适合你的手帐和个人喜好的...
高能预警!iOS上这6款App也太好用了,不占内存而且超级好用!如果你没用那真的太可惜了!日常使用中,很多人都会忽视iPhone自带APP的强大,总觉得在应用市场下...对...
语音转文字转换器怎么使用?我们在开会的时候,如果记不完领导们说的话,就可以将声音录下来,等到会议结束后把这些录音转换成文字,今天来给大家介绍一个语音转...
要将手写的稿子转换为PDF格式,需要使用扫描仪或手机应用程序进行扫描。扫描后,将扫描文档保存为图像文件,如JPG或PNG。接下来,使用PDF转换器将图像文件转换...
没有借条生成器,需要借贷双方达成合意后手写。没有借条生成器,需要借贷双方达成合意后手写。
1、我们找到一些合适的字体后,进行解压。2、然后点击字体的程序,进行安装字体。3、字体的安装,需要等待字体的安装进度。4、字体安装完成后,我们打开PPT软件...
书法生成器我还没有接触过,查阅资料大概知道,是可以把书写内容根据个人喜好转变成一些已存的名人书家字体,至于怎样转换到微信聊天里当然更是不懂。不过对于书...
特殊字体指的是与常规字体不同的字体样式,例如艺术字、手写字、装饰字等。要实现特殊字体,可以使用电脑上的字体编辑软件,如Photoshop、Illustrator等,或者在...
对于一些图片上的字,有以下几种方式可以制作:1.通过图像编辑软件,比如AdobePhotoshop、GIMP等,在图片上添加文本文字图层,通过文本工具输入所需文字,可...