尽管凌晨三点多才睡,第二天早上, 邵逸明还是八点钟准时起床, 把自己打扮得人模狗样, 踩着九点钟的线到达了公司。
邵逸明做动画三年,做互联网运营五年, 然后辞职开了自己的公司。这家公司规模很小, 至今也才只有二十几个人, 创业方向是这两年逐渐兴起的音频付费。
公司好不容易走到了a轮融资阶段,只要拿到第一笔融资, 创业就初步成功了。如今正是最紧要的关头,不能出现一丝差错。
创投大会从上午十点进行到下午三点, 三点过后是投资方和创业者自由约谈的时间。十点钟,邵逸明带着几名员工来到了大会现场。
他的演讲在十一点半左右,正好是上午场的压轴位置。
听到自己的名字, 他整了整衣领,自信满满地踏上舞台。
“这些年来,随着互联网的高速发展,信息传播从两级变成多级,去中心化概念越来越热,也就导致了ugc平台的兴起,ugc成为内容领域人人追逐的模式。”
“ugc是什么用户创造内容。不错, 它具有很好的多样性、娱乐性和丰富性, 所有做运营的都知道, 用户才是最优质的内容输出者。但是今天, 我要在这里给它泼一盆冷水ugc模式不适用于音频领域。”
“到今天为止,音频领域的ugc内容有什么歌曲翻唱、有声书,其他的呢没有了。这两项是目前最成熟的音频ugc,让我们来看看它的现状。”
“歌曲翻唱,很难通过歌曲本身来获得盈利,必须通过直播等其他形式,也就是说,它本质上其实不属于付费音频,不是我们这个行业要做的事。至于有声书,关于用户自行制作的有声书,侵权问题都还没得到认定,盈利更是完全不可能的事。”
“其他的有声内容,诸如有声节目、广播剧、原创歌曲,并不是用户可以产出的内容。对业余用户来说,它的门槛太高了。我们看到现在有许多广播剧爱好者,自发组成团体制作广播剧,但是这种业余团体,一般只能出品一到两期短篇剧集,无法维持一个长期稳定的更新状态。这种是很难去做付费的,它不是一个优质可持续的付费内容。”
“诸位,ugc在音频领域的路全都被堵死了,在我们这个行业,不存在ugc付费。”
邵逸明的演讲,一上来就是dissugc,与行业内主流的“寻求ugc新模式”的声音截然相反,很是吸引了一大批投资者的兴趣。
他自觉火候已足,便转移了话题,不再dissugc,开始讲述自己公司的“打造精品gc”创业理念。
邵逸明做了五年运营,参与过的融资不下三次,他太清楚怎么去吸引投资者了。风投大佬们除了看团队、看产品,最喜欢的就是看一些玄玄乎乎的创业理念,哪怕团队稀烂、产品还未成型,只要理念到位,钱就可以到位。
邵逸明发言完毕,台下掌声雷动,他心满意足地走下去。
刚一回到座位上,就有人来搭讪,“邵总,我们xx风投的代表想和您约一面,请问下午有时间吗”
邵逸明春风满面地应下一个又一个邀请,下午的安排从三点一直排到了八点。
与此同时,同一座城市的另一栋大厦里,回声科技的员工正在忙碌。
程涛最近特别春风得意,他原本只是回声的一个项目经理,和楼清焰签订外包合同的时候也没想太多,觉得语音合成应该适用于回声配音这个项目,结果没想到,何止是适用于回声配音,这个技术可以把整个回声都捧到天上去。
回声科技的研发方向是人工智能 语音,而楼清焰交出的语音合成软件,在这个领域里已经达到了登峰造极。
可以这么说,这项技术到手,整个回声的所有研发项目全都废了,必须来一次整体的更新换代。
那天见完楼清焰回去,处在惊骇中久久不能回神的程涛,不顾已经是下班时间,直接一个电话把回声总裁ca了起来。
总裁下班被ca自然非常愤怒,但在程涛的强烈要求下,还是忍着脾气回到公司。
但是看到语音合成软件之后,他的一切脾气都消失了,只剩下怎么压都压不住的惊涛骇浪。
他震惊了十分钟,然后闭目思考三十分钟,睁开眼睛第一件事,把程涛从项目经理提成了研发总监。
然后叫停了回声的一切在研项目。
连夜叫停,搞得整个公司人心惶惶,还以为公司是不是要倒闭了。
第二天,经历惊涛骇浪洗礼的就变成了这些研发人员,他们被叫到一起参观新的语音合成技术,然后一个个震惊到话都说不出来。
科技公司的研发部肯定和学术界挂钩,这群人每天必看学术新闻,时刻关注前沿技术的进步。不是他们没见识,而是无论是多么权威的学术期刊,都不曾登载过如此惊世骇俗的技术。
是的惊世骇俗。
这项技术厉害到了什么地步呢就算他们拿到手,也只能短暂地独享一段时间,然后大概会在各方压力下被迫作出一些利益让步。因为它实在是超前太多了,如果仅仅超前一点,还不至于这样。
软件代码摊开在编译器上,竟然没有一个人能够看懂,这个软件的算法有60是全新的,实现算法的数学模型更是闻所未闻见所未见。
回声研究员震撼我全家。
这也是楼清焰愿意把技术换给回声而不是自己做的原因之一。他连特效插件都保不住,怎么可能保得住划时代的语音合成如果在羽翼未丰前就捏住了这么吊的技术,不被吞并几乎不可能。
深空科技最惧怕的就是被巨头吞并,君不见bat现在多么爱玩大鱼吃小鱼的游戏。为了让深空可以坚持不融资,楼清焰都能费尽心机搞出二十亿神话,自然不会允许这么大的威胁出现。
回声就不一样了,公司体量已经做起来,不是想吞就能吞的。
但是,把这种划时代的技术交给其他公司,楼清焰不是吃了个大亏吗
回声总裁也在思考这个问题,直到程涛对他说“你忘了吗,我们和他签的是对赌协议。”
不但是对赌协议,还是一份前所未有的“技术对赌”。
如果深空最后交给回声的软件能完成xx功能,回声就必须履行xx条款,这样的对赌协议。
回声总裁那时觉得只是一个小项目的外包,并没有太关注这个事,此时想起来,颇觉震撼,“那我们答应了什么条款”
程涛深深地把头低了下去。
当初看那些条款那么不切实际,他以为深空也拿不准能不能开发出具体功能,只是尽量往高里写。毕竟对赌嘛,上限越高越好,万一就出奇迹了呢
谁知道,对他来说是奇迹的东西,对fire来说,全是顺理成章。
回声总裁只听了第一个条款就够够的了,“什么叫技术相关盈利10都给他这特么不是凭空套走了我们公司10的股份”
不是他夸张,语音合成这个技术一出现,回声所有开发组势必要学习,然后要把学来的东西应用在其他项目里。回声科技所有的产品,都得在这项技术的指导下更新换代。楼清焰张口要来10的技术相关盈利,就和拿了他们10的股份没有差别。
程涛只好说“有时限的,有时限的”
比起这一条,其他条款也不算什么了,总裁扫了一眼,也没脾气了,温和地说“这是让我们帮忙扶持他的繁星网这和我们自己做一个平台网站有什么差别”
他真的很温和。就是程涛没敢接话。
这些都是前事了,时间回到现在,语音合成和繁星网即将联合发行,程涛正在监督前期工作。
是的,只有程涛。至于fire,那是谁
深空不存在的。宣发工作全是回声在搞,深空只管坐享其成。
程涛一边坐在那等时间,一边想起了楼清焰这个人。
一个失去继承权被赶出家门的富二代,曾经的全平台第一网红。
曾几何时,他的人生就是炫富、扔钱、吃喝玩乐。他有一句著名的言论“每天早上醒来都有两个烦恼,第一烦恼今天该怎么烧钱,第二烦恼今天该怼谁。”
楼清焰的人品其实并没有什么污点,也没有不能容忍的黑历史。他只是得瑟了点、幼稚了点、愤青了点。
但他的人生太让人羡慕了。随心所欲,爱做什么做什么,永远不用容忍不顺心的事,看不服谁就骂谁,被一个儿控老爸全力宠着每个人都会或多或少产生一点嫉妒或者仇视,所以他的黑粉铺天盖地。
所以,当他跌落谷底的时候,尽管他才是那个受害者,人们却只感到幸灾乐祸。
楼清焰的社交平台已经不更新了,每天仍有无数人追在下面嘲讽,用着那些看到都觉得脏了眼睛的词。
他们以这种嘲讽来发泄自己一整天积攒的愤怒,仿佛楼清焰的销声匿迹是他们对战现实的某种胜利。
十二点,时间到了。软件官网发布,电脑端和移动a挂上应用商城,广告商发来ok的手势,繁星网正式上线。
程涛看着发布出去的网站页面,忽然起了一身的鸡皮疙瘩。
谁也不知道,那个已经销声匿迹许久的落魄二世祖,正在改变世界。
下午三点,邵逸明准时来到约好的地方,等待和投资方的会面。
然而,他却只等来一个被放鸽子的通知。
“抱歉,我们经理临时有事,不能过去了。投资的事情,以后有机会再谈吧。”
有机会再谈还有什么机会
这分明就是拒绝
如果只单单是一家的拒绝也就罢了,然而,在接下来的几小时内,邵逸明收到了所有预约企业的拒绝。
晚上八点,不管他苦苦哀求多少遍,最后一家风投也还是没来。
他一个人坐在餐厅里,呆呆的,心想完了。
融资泡汤了。
凡是对付费音频有点兴趣的投资方,都参加了这次创投大会。如果在大会上没能拉到投资,接下来再拉投资的希望就渺茫了。
付费音频是新热点,行业拓荒者数不胜数,且已经有了珠穆朗玛那种成功的企业,没钱就没法高速铺开业务,就抢不过别人,就注定失败。
完了,一切都完了。
窗外华灯初上,邵逸明的脸反射在玻璃上,长达一个小时的时间,他脑中一片混乱。
一个小时后,他突然想为什么
为什么会被那么多家风投连续放鸽子难道是背后有人在搞他
还未来得及仔细思考,员工电话打进来,大呼小叫地跟他说“邵哥你看到了吗变天了怎么办我们怎么办啊”
“怎么回事”邵逸明这会儿异常冷静,嘴里回答着电话,脑海里还在想,谁会费这么大力气给他使绊子。
“快去看看新闻啊邵哥都一下午了难道你还不知道吗”
邵逸明飞快挂掉电话打开新闻网站,一个不容忽视的大头条挂在那里。
“回声科技今日震撼发布,划时代语音合成技术,我国人工智能已领先世界”
他呆了一瞬,才打开新闻,拉下去细看。
整篇新闻的口吻带有一种明明很激动却强自抑制的感觉,这小编也真是厉害,用特别理性客观的文字把回声从上到下夸了一个遍,还不着痕迹地介绍了新软件的各种功能。
软件的名字很普通,就叫回声配音,和之前一模一样。
只不过之前的回声配音是个网页程序,这回有了客户端。
“基于这种划时代语音合成技术,回声科技目前仅发布回声配音一项产品,仅仅是这一款软件,已经展现出令人震惊的功能效果。这一技术的后续开发非常值得期待。”
邵逸明看完软件,强压着内心的惊疑不定,去应用商店下载了手机a。
移动端的a设计非常简单,就是输入一段文字转换成语音,带有简单的参数调试功能。
ai配音对硬件的要求相当高,手机端不能一次转换太多内容,一次输入仅限五十字。
邵逸明第一时间想到那个刚刚通过海选的动画剧本,随意从剧本中拉出一句词输入进去。
文字输入完毕,蹦出挑选音色的选项,预置音色有最基本的童音、少年、青年、中年、老年,每一样都分男女。
点击某个音色,就直接输出声音。
仅仅是一句简短的对话,邵逸明点开每一个音色来回听了三遍,越听越觉得难以置信。
是语音合成,真正的语音合成。
和软件唱歌不一样,语音合成不是简单的声音排列组合,还需要自然语言处理,识别文字语义等等。现在,程序识别出了某句话的语义,根据语义配置了合理的起伏、韵律和声调,然后播放出来。
逼真程度之高,就像是有一个真人在手机里说话一样
程序的表达不一定最动听,但绝对是符合语境的,让人找不出违和感。
换句话说,软件不具有顶尖配音演员的实力,但是却具有普通配音演员的能力。
邵逸明强自镇定,安慰自己说平平无奇,没有灵魂。别怕别怕。
机器终归是机器,就算能配音,也只是套路化模仿人的语气,配不出有力量的情感表达。就像是演技拙劣的演员非要去演戏
他随便选了一个音色,点击确认,来到了下一个页面情感选择。
下面有四个滑条,分别是喜悦、激动、愤怒、恐惧。
邵逸明滑动这四个滑条的时候,感觉异常不真实,就好像在滑动图片的rbg滑条一样。
滑动之后,实时生成的语音果然出现了微妙的语气变化。
这一页下面还有一样小字“登陆电脑客户端,调节更多情感维度,还可以自行设计维度模型,保存参数建立情感滤镜。”
邵逸明犹豫了一下,没有理会,点击确定来到下一个页面。
这一步的名字叫“音频液化”,选择一个参数,在屏幕上生成一条曲线,手指涂抹就可以改变曲线的形状,纵轴是该项参数,横轴是时间。
音量是一条直线,用手指向上抹出一个小山包,山包对应的时间段的音量就会发生变化。
语调是曲线,可以用手指涂抹直接改变声调的上扬或下抑。
语气轻重是折线,可以制造强调声或轻声。
发声位置,可以调出气音、鼻音、胸腔共鸣、丹田发声不同的效果。
还有音高、语速等等各种各样的参数。原本“平平无奇没有灵魂”的普通对话,可以在这个界面往千奇百怪的方向去调整,输出令人叹为观止的多样性成果。
第四步就是最后一步,完成这一步之后,系统就生成了3文件。
邵逸明听了一遍又一遍,最后靠在椅子上,用手盖住脸,长叹一口气。
除了音色有些出入,这整句话和他所设想的一模一样。
过了半天,他终于找到理由安慰自己“第四步也太复杂了,选择困难症怕不是能玩一年。要是都这么一句话一句话地调,猴年马月才能完成一段配音”
厉害归厉害,效率反而降低了。
这个想法刚一冒出来,a页面弹出提示“是否感觉参数太细致,建立音频太麻烦,耗时过长下载c客户端,体验高效率ai配音。”
邵逸明立刻捕捉到关键点c端的功能更加强大
这个手机端时时刻刻都在给c端打广告,很明显只是c端的一个推广试验版。
移动a已经强大如斯,c端的完整功能该有多么恐怖
邵逸明立刻起身,连回家都等不及,找了家最近的网吧,开机直接下载软件。
比起手机端的简易,c端显得过于臃肿了。光纤网速下,软件下载了整整一个小时,又安装了半个小时,才总算弄好。
这是个付费软件,全功能试用一周,简单功能试用一个月。
邵逸明迫不及待地点进去,发现它比起手机端的确是强大了不少。
文本输入方式变成了导入文本文件,没有五十个字的限制,一次可以导入数千字的文本。
他直接登陆云盘把自己的剧本下载下来,从里面选了一小段导入进去。
文本读入后,显示在左侧的空白框里,系统自动识别文本格式,广告词、小说、剧本,都会有不同的排列方式,对应不同的窗口布局。就像s一样,根据画画、修图、平面设计不同的功能,会有不同的窗口预设。
文本一导入,软件就蹦出提示,“监测到您的文本类型为剧本,是否切换为广播剧模式”
切换之后,整个窗口布局大变样,被分成了五个模块。
左上是文本时间轴,一行一句文本,对应着音频时间线。左下是角色窗口,从剧本中自动识别出的几个角色已经整整齐齐排列在里面,点开之后是自定义角色卡,包括该角色的音色、情感滤镜、语速语气等等。
右上是属性编辑器,右下是音效素材库。
整个页面最下方是一条多轨道时间轴,可以对音频进行整体的编辑。
这么一看,这个软件就已经专业得不行,ui设计功力不逊于adobe系列。
第一步依旧是选择音色,但不再直接输出音频,而是选好音色后,填到角色卡里。
邵逸明选完第一个角色的音色就悟了,他应该先把这些角色卡填满,然后再去调整生成的音频参数。
除了常规的语速语气等,角色卡里还有“情感滤镜”选项,可以选预置的,也可以自定义。自定义窗口里足有二十多个情感维度,开心、同情、嫉妒、失望二十多个滑条看得人眼花缭乱。
一个角色不可能永远高兴或永远悲伤,邵逸明填完第一个角色,想了想,复制出一份,在角色名字后面加了个括号低落,微调了一下参数,换了一个滤镜,用来表示该角色不开心时的状态。
很快,各个角色以及它们的复制体建立完毕,可以开始编辑详细语句了。
每一句的可编辑参数都显示在右侧属性编辑器里,和角色卡里的参数几乎一模一样,也有情感滤镜选项。邵逸明立刻意识到,所谓的角色卡,其实就是一个参数模型。
属性编辑器里,唯一和角色卡不一样的,就是音频液化曲线,像手机a一样,可以对某一个句子的不同时间点,进行最细微的调整。
编辑完角色、编辑完语句,软件自动合成音频,这段音频显示在右下方的音效素材库里,可以拖入多轨道编辑器进行剪辑。音效素材库链接到云端,用户可以从中下载所需要的任何音效。当然,也可以自己导入。
到这里为止,这个软件只是普通的配音软件而已,功能无非是模仿人类的声音,细化了各种可调参数。
用这个软件来做广播剧的话,只要设定好角色,输入剧本就可以输出音频。但这样做出来的广播剧非常“标准化”,用邵逸明的话说就是“平平无奇、没有灵魂。”
如果对广播剧进行精细化的微调,可以达成很好的效果,甚至能调出专业配音都达不到的水平,但那样又太慢了,要一点一点抠到天荒地老。
邵逸明心想,这个软件是不是有点鸡肋一键生成的作品比较粗糙,精细制作的效率又不如人工配音。
当然,可以用这个软件生成大量粗糙的ugc作品,人们对ugc作品的要求一向很低,就像网友自己利用游戏制作的电影,再粗糙也有粉丝。
但它也只能用大量粗糙作品填充低端音频市场,或者出一两部极其精细的“神作”,真正的中端精品内容,还是只能由gc产出。
这个想法才刚冒出来,邵逸明突然发现,软件里还有一个功能。
“ai换声,这是什么”
他一下子打了个激灵,想到ai换脸、ai换人“草,不会是我想的那样吧”
还真就是他想的那样。
ai换声的功能是,可以自己为某个角色配音,ai系统会学习他的声学数据,换成系统预置音色。类似于变声器的功能,但不是实时变声。
弄懂这个功能之后,他直接摘下耳机,坐在椅子上,喃喃道“补齐了。”
软件的最后一个缺陷也补齐了。
精细制作效率低不,我们可以ai换声。嫌调参数麻烦,就自己配音,再换成角色的声音。
邵逸明是做音频内容运营的,他一下子就想出了,这个软件发布后,广播剧的制作模式将会发生多么翻天覆地的改变。
在低端市场,只要设定好角色、输入剧本、适当添加音效,就可以一键生成广播剧。这种广播剧比较套路化,该有的语气声调样样不缺,但比较缺乏表现力。这就像是一部演技很差的偶像剧。
在中端市场,依旧是按照上述模式生成广播剧,但在比较关键、比较需要表达力的篇幅上,可以由配音演员进行配音,再替换成角色的声音。全程配音替换也可以,总之,只要一个配音演员够了,一个人就能完成一整个剧组的工作。这种广播剧就像是偶尔演技爆发的普通电视剧。
在高端市场,用软件对广播剧进行不厌其烦的精细微调,可以完成非常高级的表达。这种广播剧,大概就像演技爆棚的大电影,普遍意义上的“神作”。
一部广播剧所需要的人才依旧是三种编剧、导演、配音,但团队急剧缩水,最多只需要三个人。
一名编剧足以自己完成一部低端剧集,再加上一名配音,可以完成中端或高端剧集,如果编剧本身就是配音那更好了。至于导演,可有可无。
两个人能做,一个人也能做,超高效率的广播剧内容产出,这就是、这就是
“这就是付费音频的ugc模式”已改网址,已改网址,已改网址,大家重新收藏新网址,新 新电脑版 ,大家收藏后就在新网址打开,以后老网址会打不开的,,
本站所有小说均来源于会员自主上传,如侵犯你的权益请联系我们,我们会尽快删除。