HuggingFace_借助ai实现图片转文字以及音乐,还有更牛的文字生成音乐功能

之前小啦分享过不少AI类工具,像AI绘画、AI语音、AI图片修复等都是非常好用的工具,不过呢这些工具普遍也存在一个问题:功能过于单一,要么只能处理图片,要么只能处理语音

如果能有一个AI工具将图片与声音或将文字与声音结合,也许就会有趣不少。

你还别说,小啦还真找到了这么一个牛掰的工具,只需上传一张图片或一些文字,就能生成一首30秒的音乐!

1、Hugging Face(网站)

这是国外的一个开源项目源项目,拥有文字生成音乐、图片生成音乐、图片生成文字等功能。

上传对应的内容,稍等一会,他就会根据算法来生成一段30秒长的音乐

  • 文字转音乐

它最基础也是最牛的功能:文字转音乐。

只需在Prompt中输入文本内容,并以逗号分隔即可。输入完毕后点击Submit,它就会根据文本内容自动生成音乐

HuggingFace_借助ai实现图片转文字以及音乐,还有更牛的文字生成音乐功能

注意:由于是国外的网站,关键词需要用英文。

比如,这里以女孩(girl)、风(wind)作为关键词生成一段音乐。把这两个关键词结合在一起,你会想到什么?让小啦来说的话,就是活泼的女孩,宁静的风

HuggingFace_借助ai实现图片转文字以及音乐,还有更牛的文字生成音乐功能

听听生成的效果,一整段活泼轻快的音乐,是不是特别符合活泼的女孩在风中徜徉的那种气氛

再以山、水作为关键词生成一首音乐,这个效果我直接卧槽了!颇有种高山流水、仙音悦耳的感觉,大写的牛!

  • 图片转文字

之前给大家安利的AI绘画工具都是把文字描述的内容转换为图片,今天,咱们直接来一波反向操作,直接把图片转换成文字。

上传一张,点击下Submit,稍等一会儿,就能获取机器对文字的描述了。

HuggingFace_借助ai实现图片转文字以及音乐,还有更牛的文字生成音乐功能

来一张街道的漫画图,看下效果。

HuggingFace_借助ai实现图片转文字以及音乐,还有更牛的文字生成音乐功能

都是英文,看起来有点麻烦,翻译中文:

一幅有高楼的城市街道的绘画,詹姆斯·吉列德,CG Society,美国场景绘画,(紫色),进入蜘蛛世界,宽屏拍摄,纽约,加密的虚拟世界,风格绘画,来自复仇者联盟(2012),卡通着色器,cp2077

描述还是挺准确的

如果换成小姐姐会发生啥呢?不废话,直接来个试试。

HuggingFace_借助ai实现图片转文字以及音乐,还有更牛的文字生成音乐功能

一个穿着连衣裙的女人坐在椅子上,灵感来自张舒淇,黑色的短卷发微笑,撩人的身体与性感的腹部,macross边疆,流动的姜黄色头发,老写真书,美丽的窗帘,风移动她的衬衫,华丽的斯特拉梅芙魔术师,照片,年轻,裸露。

关键词基本都出来的,唯一比较难受的是描述有点机械和呆板

  • 图片转音乐

图片转音乐,也就是大家在开头见到的那个效果,上传一张图片,点击Generate Music from Image,稍等片刻,一首图片的专属音乐就轻松诞生了!

老规矩,还是先来张小姐姐的照片,看看效果。

HuggingFace_借助ai实现图片转文字以及音乐,还有更牛的文字生成音乐功能

喝奶茶的时尚小姐姐,生成一段赛博朋克风的BUG没毛病吧?大家听听这欢快又不失科技感的节奏,和图片还是相当搭的。

这一段我承认,确实差点意思但也还能接受,现阶段AI能达到这种程度已经相当了不起,咱也不能要求所有情景都能100%到位

当然,除了上面给大家展示的内容外,如果选择合适的图片或文字,甚至还会产生一些奇奇怪怪的声音,但为了防止有人社死,小啦就不放出来了,如果想要体验,可以直接将梵高的《星月夜》转换为音乐

2、Hugging Face(地址)

https://ml.huijiala.com/url-4080.htm(文字转音乐)

https://ml.huijiala.com/url-4081.htm(图片转文字)

https://ml.huijiala.com/url-4082.htm(图片转音乐)

版权声明:本站文章大部分为原创,有小部分整理于自互联网。主要目的在于分享信息,版权归原作者所有,内容仅供读者参考。如有侵权请发送邮件至shenma006@gmial.com删除。备案号:晋ICP备2023001592号-1
(2)

相关推荐

发表回复

登录后才能评论