日期:2023/06/16 22:16作者:佚名人气:
5月29日,英伟达CEO黄仁勋在COMPUTEX大会上现场展示了AI谱曲功能,只需要几个关键词就能生成曲子,看着发布会老黄的K歌现场,我仿佛看到了新一轮的AI革命拉开了序幕。本周我们将继续为大家推荐一些有趣且使用便捷的AI工具,同时,我们也会简要介绍它们所涉及的领域和应用情形,希望能对各位有所帮助。
No.1
Swapface
(AI换脸软件)
按照Swapface官方的说法,作为一款AI换脸软件,它是目前全世界最轻巧、超逼真、最实时且最便于使用的AI换脸工具。实际体验下来,我认为官方确实没说大话——高度集成化的功能、简洁的操作界面以及真实的渲染效果,都令我对这款软件刮目相看。
作为一款需要在本地运行的AI软件,Swapface目前仅支持Windows 10系统,且对CPU算力要求较高,所以大家下载安装时请务必先确认自己的电脑配置,以免发生报错而无法使用。
在功能方面,Swapface主要包括Stream Faceswap(实时换脸)、Video Faceswap(视频换脸)和Image Faceswap(图像换脸)三大功能,并且支持用户自定义上传头像图片用作替换素材。
但对于Swapeface来说,它最主要的Stream Faceswap(实时换脸)功能支持用户自行设置摄像头视频导入以及实时导出流式传输。这意味着,我们只需要选择一个角色人脸,点击“Start”,就可以对摄像头捕捉到的人物面部视频进行实时更换,不管是应用于在线会议或是直播,都为我们提供了一种便捷的体验。
使用指南
进入官网按照指示跳转至MEGA云端,将本体下载至本地进行安装,新用户需要对账户进行注册(支持国内邮箱),安装完成后即可使用,可自行上传图片作为替换素材,部分功能收费。
好说AI工具链接
No.2
Tango
(流程可视化)
本月最强工具,没有之一
Tango 是一款可以将操作流程转化为分步指导的AI工具——无需视频、会议或屏幕共享,正如同它的名字一样,Tango很好的证实了一种人机高度交互的智能工具的可行性。
通过这款工具,我们可以向任何人解释任何事情的操作流程:只需要通过Tango完美裁剪的屏幕截图,就可以将任何过程变成精美、可共享的操作指南——用户只需要单击一下“开始”按钮,其他全部交给AI来完成。
在实际使用过程中人机界面图片素材,Tango可以捕获任何网站或者是浏览器应用程序上的进程并对其构建。另外,针对部分敏感信息人机界面图片素材,开发团队设置了“一键查找”功能,可以自动对不方便展示的个人、客户和公司数据进行模糊化处理。在生成分步流程后,用户可以通过直接发送链接、嵌入网站或者直接导出的形式对生成的交互式演练结果进行分享。
此外,Tango还支持用户评论反馈的收集与整理,根据用户的跟踪进度,Tango可以提供针对性帮助以及生成自定义报告等多种企业辅助功能。同时,Tango强大的的外部拓展功能则支持用户结合实际工作流程生成SOP,只需在PC端进行一次完整操作,剩余记录与排版即可全部交给AI解决。
使用指南
使用谷歌账号注册完毕,在安装之后会生成一个单独的操作界面,该操作界面下可以对用户操作流程进行记录。最终,只需要在Web端正常操作,AI将自动记录下全部操作流程并直接生成可分享的交互页面。同时,Tango可以支持Chrome 浏览器扩展和其他拓展方式辅助自动对操作流程的捕捉。
好说AI工具链接
No.3
Boomy
(AI编曲)
Boomy是一款AI作曲软件。好说AI上周曾向大家介绍另一款作曲工具TuneFlow,大家都对它强大的专业性与简洁的操作感惊叹不已。但TuneFlow的用户群体大多是具备乐理知识的专业作曲人,对于纯音乐小白来说使用门槛较高。而Boomy的推出,则更多面向着大量不懂音乐知识且作曲感兴趣的用户群体,使用Boomy时不论你是否有乐理基础,都可以轻松生成自己的AI音乐。
在音乐创建方面,Boomy支持现有风格的模仿以及用户自定义曲风。以“风格模仿”来举例,用户只需要从系统默认的几种预设风格中进行选择,对每种风格的音乐采样进行预览后,选择适合自己需要的风格,AI即可生成相应风格的曲子。
不过,我们在实际使用过程中也发现了一些问题:比如模板生成的曲风过于单一,又或者用户可自定义选项过少等等,显然AI的参与并没有让Boomy生成真正意义上的音乐。我个人理解Boomy更像是一个节奏曲风生成器,在编曲的专业性上,完全交由AI负责的Boomy和仅使用AI辅助的TuneFlow之间有着较难逾越的鸿沟。
因此,即使Boomy占据了全球14%的乐曲生出量,我还是难以将其定性为一款好用的生产力工具。但如果我们将其作为一个趣味小工具,倒是可以让用户以更低的门槛享受到音乐制作的乐趣,这也许才是它存在的意义。
使用指南
登录Boomy网页端,进行账号注册即可使用:选择喜欢的模式,点击右侧的“播放”按钮可以试听音乐,选择好适合的音乐风格,再次点击Create song按钮,稍加等待后,系统就会随机生成一段完全原创的音乐。
好说AI工具链接
No.4
Sandi
(AI口语评测)
作为一款剑桥大学的研究项目,Sandi的设计初衷是为了帮助各地的英语学习者掌握正确的口语发音。它是一款将语言模型应用在口语评测上的AI工具,实测之后实在令人感叹,不愧是剑桥大学的研究项目,在体验上与传统的口语陪练简直是天差地别。
作为一个完全免费的项目,Sandi支持用户进行全语音式交互,通过使用者对机器人问题的回复,来对用户的语音进行声纹采集和实时分析,再根据CEFR标准对使用者的口语进行打分。正如项目的名称Speak & Improve所表达的含义,研发团队希望所有的人都能够通过与Sandi的口语交流,使自身的英语水平得到提升,无论是工作、学习、考试或者仅仅为了娱乐,Sandi都将帮助你了解自身的口语能力。
顺便一提AI机器人Sandi对我的英语口语给出了CEFR Level C1的打分
使用指南
登录Sandi官网,使用麦克风与机器人进行对话,回答完成Sandi提出的8个问题,完成后机器人即可对你的口语水平进行CEFR标准评分。
好说AI工具链接
No.5
Paragraphica
(AI相机)
Paragraphica是一款由自定义文字参数生成实时照片的AI系统,最开始我以为这只是一个调用了SD端口的玩具化工具,但实际深入了解,我发现这个系统所展示出来的实际意义远比想象中要深刻和复杂得多。
Paragraphica实体机外形像是一个相机,或者说它的硬件部分被刻意设计成了相机模样,同时摒弃了大量绘图模型所采用的文生图功能——它使用实际生活中的实时参数进行照片拍摄,在采集到当前地标的实时数据后,系统将其转换成AI生成的照片。
根据制作人Bjørn Karmann的原型机展示,该“相机”没有镜头,取而代之的是像传感器一样的发散天线,机身上方配置有物理旋钮以便进行参数调节,且本体需要联网进行工作。而除了实体机外,Bjørn Karmann还开发了网页虚拟机,用户可以在网页端自定义输入天气、周围环境和时间等参数,从而生成当前位置的照片。
根据作者自己实拍的照片与AI生成的实时照片进行对比,不难看出两者之间存在着很多微妙的一致性,这意味着也许我们找到了一种方式,能够看到AI眼中所呈现的世界。
使用指南
登录Paragraphica虚拟机网站,对坐标参数、气温、环境等实时信息进行修改即可生成目的地的实时照片。
好说AI工具链接
No.6
Recraft
(AI作图)
作为一个人工智能画板,Recraft支持用户编辑并生成各种风格的插图,在Recraft生成的图像可用于商业用途。
Recraft的操作界面虽然极其简洁,但却有着相当数量的艺术风格预设供用户调取使用,同时它生成的图像尺寸可满足网站、印刷和营销等不同需求。其巨大的可操作区域能够让用户更直观的对图片元素进行控制与设计。
在作图方面,Recraft支持矢量图片、插画、图标、象形图片、3D插图、写实风格插图以及背景制作这7种主要的图片种类。以矢量图为例:我们可以在AI的协助下通过自然语言进行矢量图生成,也可以对生成图片进行个人风格的渲染,而其中重绘程序的辅助功能可以帮助设计师用最少的步骤实现自己各种可视化想法。
根据开发人员的说法:Recraft的运用能真正的释放设计师的创造力并且帮助他们产生迷人的视觉内容。
使用指南
登录Recraft网站,通过谷歌账号进行注册,进入主页面后选择预设风格即可通过自然语言生成不同图片。
好说AI工具链接
No.7
Dreamore
(解梦网站)
Dreamore是一个有趣的AI解梦师,正如它的名字一样,Dreamore通过AI可以对你的梦境内容进行解析。
网站内分别有弗洛伊德、周公、科学和湿婆这四种不同的AI模型,可以从不同角度帮你进行梦的解析并生成解析报告和图片。
至于准不准嘛,不重要,主打的就是一个趣味性十足(笑)。
使用指南
在Dreamore网页端输入文字描述,再选择相应的模型解析即可。
好说AI工具链接
以上就是好说AI本周为大家推荐的全部AI工具,希望能为大家的生活、工作带来更多帮助与乐趣。下期再见!