和胡宁一起进入这一新方向的,是2008年7月底才加入谷歌的清华大学博士路羊。一直在学校里研究信号处理的他本以为加盟谷歌这家搜索引擎公司之后可以告别老本行,没想到不仅不能如愿,还在胡宁的要求下读了厚厚一摞论文,并时不时拿出数学书来进行研究。而林斌在拣选全球工程师资料时,又在苏黎世发现了一名学术背景和胡宁、路羊相似的工程师,亦邀请他越洋加盟。
光是找出几个通行于所有歌曲的标准,已非易事。如果让普通人来设定歌曲特征,人们很容易想到根据快歌、慢歌来加以区分。但在技术实现上,它却是一条弯路。
为采集相关数据,路羊和苏黎世的同事在电话会议上一起听着同一首歌一起在桌子上打拍子,前后处理了大概一千首歌的数据。可他们最终遇到了难以逾越的问题:那些配乐很弱的歌本来就很难找到清晰的节奏,有些歌曲则前后节奏不一,甚至,不同的人对于节奏的判断也是不同的。人耳极易辨识的快慢,电脑分辨起来却只有80%的正确率。虽然在学术上,这已经是个了不起的数字,但在现实应用中,这就意味着五首歌里有一首的快慢是明显误判的。在路羊的游说下,以节奏快慢为特征选歌被修改成了按照强烈或舒缓分类。
在另一条战线上,胡宁推进的相似歌曲同样困难重重:她很快做出了一款覆盖几千首歌的演示产品,效果极佳,但当她把数据量上升到几万首歌,质量又惨不忍睹,只好推倒重来。
问题的核心在于,在学校时,她只要对1000首歌这样量级的数据进行分析就可以发表论文了,但她这次面对的是数以十万计的歌曲。当你只对几千首歌进行分析、聚类时,大概设定几百个音色类别,就可以把它们相对有效的归类。但数十万首歌的音色差异就实在太大了:中国歌曲和外国歌曲的音色听上去差别有限,但体现在数字上却明显不同,而有的歌只是从头到尾一个人在讲话,这样的特例怎么考虑进去,也是一个挑战。
一下子把数据量扩大到十万级来开发产品是不可能的。胡宁和路羊只能选择一种最笨而有效的方式:每次在较小的数量级上进行实验,确定可行的办法,然后针对每次数量级的扩大所带来的问题对最初的特征值确定、聚类进行调整。这意味着,每次针对较小数量级的曲库写出有效的代码,不久之后要主动扔掉。据说这个过程中,丢弃的代码大约是留下的十倍。
直到电脑处理过5万首歌,这套系统才最终比较稳定。而此时,特征值的分类已经扩大到了4096种。这似乎是个注定属于谷歌的产品:对30万首歌做一次分析和聚类需要上千台计算机同时工作数十个小时,并非每家公司都可以运作。
在谷歌音乐第二版即将发布之前三周,李开复和洪峰终于可以将产品演示给公司CEO埃里克·施密特。据在场者回忆,富有产品经验、总能一针见血看到问题的施密特这次在看过产品后,发出了疑问:“我的中国同事们,你们能不能告诉我,我该问点什么尖锐的问题?”
的确,对于今天的谷歌中国乃至谷歌全球,这都是一款足以令人惊喜的产品。
它将成为谷歌中国收复市场份额的一个杠杆?尚不能做出如此乐观的结论。一位熟悉谷歌的人士对《环球企业家》说,最令他担心的还并非接下来的广告收益状况——2009年糟糕的经济环境也许并不能给巨鲸和唱片公司们带来足够理想的收入——更重要的是,谷歌在完成一款产品之后究竟能否以更大的力度把它完善、推广出去?在批评者看来,过去一年里,谷歌中国推出产品的节奏有了明显提升,但似乎总离引爆市场差了一口气。像2008年上半年发布的谷歌金山词霸,从定位上看无疑是款好产品,却在过去一年时间里渐无声息。
好消息是,在音乐产品上,从李开复到工程师,每个人都清楚当下的产品还有着很多的修缮余地:算法可以更精确,用户介面仍有bug等着修改,甚至,当谷歌音乐的排行榜成为音乐界的一个关键指标,必须有人编写防作弊功能⋯⋯而且,别忘了,按照其最初的六步规划,谷歌和巨鲸应该在搜索产品完成后,还有广告产品、客户端播放器乃至社区服务等待开掘。
但无论如何,以改变游戏规则的方式补齐了与百度正面交锋的最后一块短板,让经历了三年半起落沉浮的本土化之后,李开复终于可以坐下来,在网络上播放一首歌平静一下心情——而且,使用他自己的产品。