本次重点关注了一下Pandora的Music Genome Project(音乐基因组计划),last.fm的分析方式基于播放历史和社会化关系的部分会更多,而不像Pandora对音乐本身有比较详尽的拆分。Spotify的相关资料较少,待查。
一、 Pandora的Music Genome Project
简要的说Music Genome Project就是通过专家的智慧,以450多种“基因”来描述一首音乐。其中一种基因代表一种声音的特征。比如“主唱的性别”“电吉他的失真程度”“背景人声的类型”等等。
Pandora将音乐先分为了了5个大类流行/摇滚(Pop/Rock),嘻哈/电子(Hip-Hop/Electronica),世界音乐(World Music),爵士(Jazz)和古典(Classical)。根据音乐类型的不同,摇滚/流行大概包含150个“基因”,嘻哈/电子含有350个,爵士乐含有差不多400个,世界音乐和古典含有300~450个。每个“基因”都会被赋予[0,5]的以0.5位单位的计量数,反应特征强度。所以在Music Genome Project的数据库中,每首歌都是由一组多维向量描述。这些tag的标注工作全部由Pandora的音乐家人工进行。一首歌需要花费20到30分钟,还需经过复核。
由“一致的标准和框架”“专家控制tag”很大程度上保证了tag的质量,但也会有一些问题,放在后文讨论。
二、 Pandora的“基因”
当你Google“Music Genome Project”时,会发现这已经是个注册商标了。且Pandora已经为这份“Genes List”申请专利,这是商业机密。不过我们还是能够从前台看到一些露出来的部分。选几个例子来看一下,流行电子,爵士,后摇,古典各选一首:
1. Owl City和蹲妹的《Good Time》
这首歌一般看就是一首典型的电子流行曲,但是展示出来的“genes”包括:
electronica influences:电子乐影响
mild rhythmic syncopation:不知道怎么翻译
heavy use of vocal harmony(antiphony):大量人声和声
repetitive melodic phrasing:重复的乐句
extensive vamping:不知道怎么翻译
a clear focus on recording studio production:不知道怎么翻译
paired vocal harmony:成对的人声和声
major key tonality:主key音调(不知道怎么翻译)
prominent use of synth:明显的合成器使用
upbeat lyrics:乐观向上的乐词
2. Max Richter的《On The Nature of Dayligt》
后摇器乐,没听见人声
a tranquil mood:心情平静
a subdued,expressive aesthetic:柔和的,有表现力的美
a feeling of melancholy:一种忧郁感
a Contemporary style:当代(?)的风格
a small string ensemble:
cello:大提琴
viola:中提琴
violin:小提琴
tonal harmony:调性和声
a slow and stately tempo:一种缓慢庄严的拍子
3. Django Reinhardt《Time on My Hands》
new orleans influences:受到新奥尔良的影响
swing influences:强节奏爵士音乐的影响
world music influences:世界音乐的影响
a mid-tempo dance style:中板舞曲风格
a violin solo:小提琴独奏
a great acoustic guitar solo:非常牛逼的木吉他独奏
a lazy swing groove:不知道怎么翻译
two-step style:两步舞曲风格
4. 巴赫《suite for solo cello无伴奏大提琴组曲》
a subdued, expressive aesthetic:柔和,富有表现力的美感
an acclaimed work:广受好评的作品
a well-known composer:著名作曲家
tonal harmony:
major key tonality:
a Baroque style:巴洛克风格
根据Pandora的Blog放出的文章,Steve Hogan在比较两个音乐作品的差异时,用了以下五个维度:
人声表现(Vocal performance)
歌词(Lyrics)
旋律(Melody)
韵律(Rhythm)
配器/乐器(Instrumentation)
Pandora后台的tag大概也是按照这五个大类区分的。
但结合上面四个例子,我认为后台的tag还会有:“Mood and Atomosphere情绪和氛围”这一大类。翻了几首器乐为主线的曲子,很多都会出现相关的tag描述。
pandora相关文章:
http://blog.pandora.com/us/from-the-music-genome-project-the-anatomy-of-a-scary-soundtrack/
三、 曲库分类
以上这几类的分类,可以区分为两种:track的自然属性和社会属性。
自然属性是为客观的天然属性:如tempo,配器,人声类型,主唱性别等
社会属性为带有打tag人经验或者情感的属性:情感,场景,还有类似【a subdued, expressive aesthetic】这类的属性。
其中第一种比较客观,但第二种会受到打tag人特质的影响,所以这类tag如果全由曲库运营来打肯定是不全且不客观的。运营者打出来的标签很可能只是“符合受过音乐高等教育的人的口味”而已。一个文艺青年可能使用打雷姐的歌做睡前放松,但这种情况会在一个朴实的劳动人民身上发生吗,显然不会。
“The idea that all music is equal and deserves equal rights is somehow fundamentally a democratic idea; as is the corresponding idea that the public, and not some small cadre of experts, is the best judge of musical quality.But the fact that some music not only attracts more listeners, but also seems to mean more to more people over a longer period of time, indicates that there is actually something fundamentally unequal about music as well.”
所以我们给曲库染色的目的是创建tag,tracks和用户三者之间的联系。有一个重点是如何把用户的影响加入到“影响tag和track”的因素里。
1. 用户 - 标签:第三方数据
- 去爬曲库中曲目在豆瓣,虾米上的用户打的tag(但是质量问题?如果不采用人工筛选的话)
- 去爬歌单豆单的title和曲目列表。提取title中关键字分配至曲目列表作为临时tag,最后做汇总,出现率高的成为正式tag
2. 用户 - 歌曲:人群属性tag
所有歌曲都应该有一个人群属性标签(什么样的用户什么场景什么时间会喜欢这首歌)
- 建立一个用户属性的分析策略:收集音乐使用案例,分析用户属性和歌曲自然属性的关系,以自然属性给歌曲打上社会属性。
- 之前叶子提到的收集卖出去音乐的用户反馈,记录用户属性+对音乐的偏好
3. 标签 - 歌曲:
自然属性标签具体要打什么,要找懂音乐的人来定,Pandora有篇报道中提到,第一次进行属性拆分的时候,一会议室的人在一小时内写出了200+的可用属性。
建议阅读:[1] 一文
部分引用来源:
[1] More on Pandora: genres, genomes, and musical taste(http://scholarslab.org/digital-humanities/more-on-pandora-genres/)
[2] wiki百科:Music Genome Project
[3] 一些采访和新闻