曲库染色

本次重点关注了一下Pandora的Music Genome Project(音乐基因组计划),last.fm的分析方式基于播放历史和社会化关系的部分会更多,而不像Pandora对音乐本身有比较详尽的拆分。Spotify的相关资料较少,待查。

一、 Pandora的Music Genome Project

简要的说Music Genome Project就是通过专家的智慧,以450多种“基因”来描述一首音乐。其中一种基因代表一种声音的特征。比如“主唱的性别”“电吉他的失真程度”“背景人声的类型”等等。

Pandora将音乐先分为了了5个大类流行/摇滚(Pop/Rock),嘻哈/电子(Hip-Hop/Electronica),世界音乐(World Music),爵士(Jazz)和古典(Classical)。根据音乐类型的不同,摇滚/流行大概包含150个“基因”,嘻哈/电子含有350个,爵士乐含有差不多400个,世界音乐和古典含有300~450个。每个“基因”都会被赋予[0,5]的以0.5位单位的计量数,反应特征强度。所以在Music Genome Project的数据库中,每首歌都是由一组多维向量描述。这些tag的标注工作全部由Pandora的音乐家人工进行。一首歌需要花费20到30分钟,还需经过复核。

由“一致的标准和框架”“专家控制tag”很大程度上保证了tag的质量,但也会有一些问题,放在后文讨论。


二、 Pandora的“基因”

当你Google“Music Genome Project”时,会发现这已经是个注册商标了。且Pandora已经为这份“Genes List”申请专利,这是商业机密。不过我们还是能够从前台看到一些露出来的部分。选几个例子来看一下,流行电子,爵士,后摇,古典各选一首:


1. Owl City和蹲妹的《Good Time》

Owl City和蹲妹的《Good Time》

这首歌一般看就是一首典型的电子流行曲,但是展示出来的“genes”包括:

electronica influences:电子乐影响

mild rhythmic syncopation:不知道怎么翻译

heavy use of vocal harmony(antiphony):大量人声和声

repetitive melodic phrasing:重复的乐句

extensive vamping:不知道怎么翻译

a clear focus on recording studio production:不知道怎么翻译

paired vocal harmony:成对的人声和声

major key tonality:主key音调(不知道怎么翻译)

prominent use of synth:明显的合成器使用

upbeat lyrics:乐观向上的乐词


2. Max Richter的《On The Nature of Dayligt》

Max Richter的《On The Nature of Dayligt》

后摇器乐,没听见人声

a tranquil mood:心情平静

a subdued,expressive aesthetic:柔和的,有表现力的美

a feeling of melancholy:一种忧郁感

a Contemporary style:当代(?)的风格

a small string ensemble:

cello:大提琴

viola:中提琴

violin:小提琴

tonal harmony:调性和声

a slow and stately tempo:一种缓慢庄严的拍子


3. Django Reinhardt《Time on My Hands》

Django Reinhardt《Time on My Hands》

new orleans influences:受到新奥尔良的影响

swing influences:强节奏爵士音乐的影响

world music influences:世界音乐的影响

a mid-tempo dance style:中板舞曲风格

a violin solo:小提琴独奏

a great acoustic guitar solo:非常牛逼的木吉他独奏

a lazy swing groove:不知道怎么翻译

two-step style:两步舞曲风格


4. 巴赫《suite for solo cello无伴奏大提琴组曲》


巴赫《suite for solo cello无伴奏大提琴组曲》

a subdued, expressive aesthetic:柔和,富有表现力的美感

an acclaimed work:广受好评的作品

a well-known composer:著名作曲家

tonal harmony:

major key tonality:

a Baroque style:巴洛克风格


根据Pandora的Blog放出的文章,Steve Hogan在比较两个音乐作品的差异时,用了以下五个维度:

人声表现(Vocal performance

歌词(Lyrics

旋律(Melody

韵律(Rhythm

配器/乐器(Instrumentation)

Pandora后台的tag大概也是按照这五个大类区分的。

但结合上面四个例子,我认为后台的tag还会有:“Mood and Atomosphere情绪和氛围”这一大类。翻了几首器乐为主线的曲子,很多都会出现相关的tag描述。

pandora相关文章:

http://blog.pandora.com/us/from-the-music-genome-project-the-anatomy-of-a-scary-soundtrack/


三、 曲库分类

以上这几类的分类,可以区分为两种:track的自然属性和社会属性。

自然属性是为客观的天然属性:如tempo,配器,人声类型,主唱性别等

社会属性为带有打tag人经验或者情感的属性:情感,场景,还有类似【a subdued, expressive aesthetic】这类的属性。

其中第一种比较客观,但第二种会受到打tag人特质的影响,所以这类tag如果全由曲库运营来打肯定是不全且不客观的。运营者打出来的标签很可能只是“符合受过音乐高等教育的人的口味”而已。一个文艺青年可能使用打雷姐的歌做睡前放松,但这种情况会在一个朴实的劳动人民身上发生吗,显然不会。

The idea that all music is equal and deserves equal rights is somehow fundamentally a democratic idea; as is the corresponding idea that the public, and not some small cadre of experts, is the best judge of musical quality.But the fact that some music not only attracts more listeners, but also seems to mean more to more people over a longer period of time, indicates that there is actually something fundamentally unequal about music as well.”

所以我们给曲库染色的目的是创建tag,tracks和用户三者之间的联系。有一个重点是如何把用户的影响加入到“影响tag和track”的因素里。

1. 用户 - 标签:第三方数据

- 去爬曲库中曲目在豆瓣,虾米上的用户打的tag(但是质量问题?如果不采用人工筛选的话)

- 去爬歌单豆单的title和曲目列表。提取title中关键字分配至曲目列表作为临时tag,最后做汇总,出现率高的成为正式tag


2. 用户 - 歌曲:人群属性tag

所有歌曲都应该有一个人群属性标签(什么样的用户什么场景什么时间会喜欢这首歌)

- 建立一个用户属性的分析策略:收集音乐使用案例,分析用户属性和歌曲自然属性的关系,以自然属性给歌曲打上社会属性。

- 之前叶子提到的收集卖出去音乐的用户反馈,记录用户属性+对音乐的偏好



3. 标签 - 歌曲:

自然属性标签具体要打什么,要找懂音乐的人来定,Pandora有篇报道中提到,第一次进行属性拆分的时候,一会议室的人在一小时内写出了200+的可用属性。


建议阅读:[1] 一文

部分引用来源:

[1] More on Pandora: genres, genomes, and musical taste(http://scholarslab.org/digital-humanities/more-on-pandora-genres/)

[2] wiki百科:Music Genome Project

[3] 一些采访和新闻

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342

推荐阅读更多精彩内容