Media Data之多媒体数据库(一)数据库结构分析

Android MediaProvider 使用 SQLite 数据库存储图片、视频、音频等多媒体文件的信息,供视频播放器、音乐播放器、图库使用。Media数据库分为internal 和external ,对应的是内部存储和外部存储数据库,两个数据库内容相似,我们分析的是外部存储设备的数据库。 外部存储数据库都是以类似 external-ffffffff.db 的形式命名的, 后面的 8 个 16 进制字符是该 SD 卡 FAT 分区的 Volume ID。该 ID 是分区时决定的,只有重新分区或者手动改变才会更改,可以防止插入不同 SD 卡时数据库冲突。接下来分析Media数据库的结构和详细信息。

1. 提取数据库

首先确保手机已经获得root权限,然后输入命令:
adbpull/data/data/com.android.providers.media/databases/external.db将数据库从手机中提取到本地。然后打开相应的分析工具,分析此数据库。

2. 数据库结构分析

Android 的多媒体数据库主要由表、视图、索引以及触发器组成。如下图所示:
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述

2.1 创建语句

下面的sql语句是创建此数据库的语句,也就是数据库模式:

CREATE TABLE android_metadata (locale TEXT);
CREATE TABLE thumbnails (_id INTEGER PRIMARY KEY,_data TEXT,image_id INTEGER,kind INTEGER,width INTEGER,height INTEGER);CREATE INDEX image_id_index on thumbnails(image_id);
CREATE TABLE artists (artist_id INTEGER PRIMARY KEY,artist_key TEXT NOT NULL UNIQUE,artist TEXT NOT NULL);
CREATE TABLE albums (album_id INTEGER PRIMARY KEY,album_key TEXT NOT NULL UNIQUE,album TEXT NOT NULL);
CREATE TABLE album_art (album_id INTEGER PRIMARY KEY,_data TEXT);
CREATE VIEW album_info AS SELECT audio.album_id AS _id, album, album_key, MIN(year) AS minyear, MAX(year) AS maxyear, artist, artist_id, artist_key, count(*) AS numsongs,album_art._data AS album_art FROM audio LEFT OUTER JOIN album_art ON audio.album_id=album_art.album_id WHERE is_music=1 GROUP BY audio.album_id;
CREATE VIEW artists_albums_map AS SELECT DISTINCT artist_id, album_id FROM audio_meta;
CREATE TABLE audio_genres (_id INTEGER PRIMARY KEY,name TEXT NOT NULL);
CREATE TRIGGER audio_genres_cleanup DELETE ON audio_genres BEGIN DELETE FROM audio_genres_map WHERE genre_id = old._id;END;
CREATE TABLE audio_playlists_map (_id INTEGER PRIMARY KEY,audio_id INTEGER NOT NULL,playlist_id INTEGER NOT NULL,play_order INTEGER NOT NULL);
CREATE TRIGGER albumart_cleanup1 DELETE ON albums BEGIN DELETE FROM album_art WHERE album_id = old.album_id;END;
CREATE TRIGGER albumart_cleanup2 DELETE ON album_art BEGIN SELECT _DELETE_FILE(old._data);END;
CREATE INDEX albumkey_index on albums(album_key);CREATE INDEX artistkey_index on artists(artist_key);
CREATE VIEW searchhelpertitle AS SELECT * FROM audio ORDER BY title_key;CREATE VIEW search AS SELECT _id,'artist' AS mime_type,artist,NULL AS album,NULL AS title,artist AS text1,NULL AS text2,number_of_albums AS data1,number_of_tracks AS data2,artist_key AS match,'content://media/external/audio/artists/'||_id AS suggest_intent_data,1 AS grouporder FROM artist_info WHERE (artist!='<unknown>') UNION ALL SELECT _id,'album' AS mime_type,artist,album,NULL AS title,album AS text1,artist AS text2,NULL AS data1,NULL AS data2,artist_key||' '||album_key AS match,'content://media/external/audio/albums/'||_id AS suggest_intent_data,2 AS grouporder FROM album_info WHERE (album!='<unknown>') UNION ALL SELECT searchhelpertitle._id AS _id,mime_type,artist,album,title,title AS text1,artist AS text2,NULL AS data1,NULL AS data2,artist_key||' '||album_key||' '||title_key AS match,'content://media/external/audio/media/'||searchhelpertitle._id AS suggest_intent_data,3 AS grouporder FROM searchhelpertitle WHERE (title != '');
CREATE TABLE videothumbnails (_id INTEGER PRIMARY KEY,_data TEXT,video_id INTEGER,kind INTEGER,width INTEGER,height INTEGER);
CREATE INDEX video_id_index on videothumbnails(video_id);
CREATE VIEW artist_info AS SELECT artist_id AS _id, artist, artist_key, COUNT(DISTINCT album_key) AS number_of_albums, COUNT(*) AS number_of_tracks FROM audio WHERE is_music=1 GROUP BY artist_key;
CREATE INDEX artist_idx on artists(artist);
CREATE INDEX album_idx on albums(album);
CREATE VIEW audio_playlists AS SELECT _id,_data,name,date_added,date_modified FROM files WHERE media_type=4;
CREATE VIEW audio_genres_map_noid AS SELECT audio_id,genre_id from audio_genres_map;
CREATE VIEW audio_meta AS SELECT _id,_data,_display_name,_size,mime_type,date_added,is_drm,date_modified,title,title_key,duration,artist_id,composer,album_id,track,year,is_ringtone,is_music,is_alarm,is_notification,is_podcast,bookmark,album_artist FROM files WHERE media_type=2;
CREATE VIEW audio as SELECT * FROM audio_meta LEFT OUTER JOIN artists ON audio_meta.artist_id=artists.artist_id LEFT OUTER JOIN albums ON audio_meta.album_id=albums.album_id;
CREATE VIEW images AS SELECT _id,_data,_size,_display_name,mime_type,title,date_added,date_modified,description,picasa_id,isprivate,latitude,longitude,datetaken,orientation,mini_thumb_magic,bucket_id,bucket_display_name,width,height FROM files WHERE media_type=1;
CREATE VIEW video AS SELECT _id,_data,_display_name,_size,mime_type,date_added,date_modified,title,duration,artist,album,resolution,description,isprivate,tags,category,language,mini_thumb_data,latitude,longitude,datetaken,mini_thumb_magic,bucket_id,bucket_display_name,bookmark,width,height FROM files WHERE media_type=3;CREATE TABLE "audio_genres_map" (_id INTEGER PRIMARY KEY,audio_id INTEGER NOT NULL,genre_id INTEGER NOT NULL,UNIQUE (audio_id,genre_id) ON CONFLICT IGNORE);CREATE TABLE "files" (_id INTEGER PRIMARY KEY AUTOINCREMENT,_data TEXT UNIQUE COLLATE NOCASE,_size INTEGER,format INTEGER,parent INTEGER,date_added INTEGER,date_modified INTEGER,mime_type TEXT,title TEXT,description TEXT,_display_name TEXT,picasa_id TEXT,orientation INTEGER,latitude DOUBLE,longitude DOUBLE,datetaken INTEGER,mini_thumb_magic INTEGER,bucket_id TEXT,bucket_display_name TEXT,isprivate INTEGER,title_key TEXT,artist_id INTEGER,album_id INTEGER,composer TEXT,track INTEGER,year INTEGER CHECK(year!=0),is_ringtone INTEGER,is_music INTEGER,is_alarm INTEGER,is_notification INTEGER,is_podcast INTEGER,album_artist TEXT,duration INTEGER,bookmark INTEGER,artist TEXT,album TEXT,resolution TEXT,tags TEXT,category TEXT,language TEXT,mini_thumb_data TEXT,name TEXT,media_type INTEGER,old_id INTEGER,storage_id INTEGER,is_drm INTEGER,width INTEGER, height INTEGER);
CREATE INDEX album_id_idx ON files(album_id);
CREATE INDEX artist_id_idx ON files(artist_id);
CREATE INDEX bucket_index on files(bucket_id,media_type,datetaken, _id);
CREATE INDEX bucket_name on files(bucket_id,media_type,bucket_display_name);
CREATE INDEX format_index ON files(format);
CREATE INDEX media_type_index ON files(media_type);
CREATE INDEX parent_index ON files(parent);
CREATE INDEX path_index ON files(_data);
CREATE INDEX sort_index ON files(datetaken ASC, _id ASC);CREATE INDEX title_idx ON files(title);
CREATE INDEX titlekey_index ON files(title_key);
CREATE TRIGGER audio_playlists_cleanup DELETE ON files WHEN old.media_type=4 BEGIN DELETE FROM audio_playlists_map WHERE playlist_id = old._id;SELECT _DELETE_FILE(old._data);END;CREATE TRIGGER files_cleanup DELETE ON files BEGIN SELECT _OBJECT_REMOVED(old._id);END;
CREATE TABLE "log" (time DATETIME, message TEXT);
CREATE TABLE bookmarks ( _id INTEGER PRIMARY KEY, _data TEXT, _display_name TEXT, position INTEGER, date_added INTEGER, mime_type TEXT, media_type TEXT);

2.2 视图

即虚拟表,它的内容都是派生自其他表的查询结果,虽然看起来像基本表,但不是基本表,因为视图的内容是动态生成的。视图的用处是将频繁使用的复杂的查询放进一个虚拟表,方便查询。在上面的创建语句中,类似CREATE VIEW既是。  
SQLite 当中视图都是只读的,也就是说不能对视图进行插入、更新、删除等操作。

2.3 索引

索引是一种用来在某种条件下加速查询的结构。SQLite使用B-树做索引。索引会增加数据库的大小,索引使用使用首先要考虑什么时候使用索引,要不要使用索引。在 Android 数据库当中基本上使用自增 id 值作为主键,并建立了索引。索引可以加快数据查找速度,但由于需要维护索引所以插入/删除等写入操作速度会变慢。在上面的创建语句中,类似CREATE INDEX既是。

2.4 触发器

当具体的表发生特定的数据库事件时,触发器执行对应的SQL指令。触发器可以用来创建自定义完整性约束、日志改变、更新表和其他操作。触发器是为了维护数据库删除操作而建立的,因为所删除的表可能与另外的表有关系,需要同时删除另外一个表的字段。可以看以下一个例子:

CREATE TRIGGER audio_meta_cleanupDELETE ON audio_metaBEGIN DELETE FROM audio_genres_map WHERE audio_id = old._id; DELETE FROM audio_playlists_map WHERE audio_id = old._id;END;CREATE TRIGGER audio_meta_cleanupDELETE ON audio_metaBEGIN DELETE FROM audio_genres_map WHERE audio_id = old._id; DELETE FROM audio_playlists_map WHERE audio_id = old._id;END;```
  这是关于audio_meta 表的触发器,意思是当删除此表上的记录时,同时删除 audio_genres_map 表上 audio_id 与此表 id 相同的记录,删除 audio_playlists_map 表上 audio_id 与此表 id 相同的记录。这样当删除 audio_meta 表的记录时,另外两个表的相应记录也会自动删除,不会由于漏删除而残留多余数据。
#3. 数据库表分析  
下面就对音频,图片和视频表进行分析和总结。
##3.1 音频  
利用PowerDesigner工具逆向工程生成物理数据模式,如下图所示,其中pk指的是主键。![这里写图片描述](http://upload-images.jianshu.io/upload_images/1819426-6c9c078652120308?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)  
下面是对上面主要的表的字段解析:
**album_art:专辑封面**
|字段|解析|
| ------------- |:-----|
|album_id|主键。专辑 id|
|_data|专辑封面缓存的路径|

**albums:专辑信息**
|字段|解析|
| ------------- |:-----|
|album_id|  主键。专辑 id|
|album_key|全大写字母,用于字母索引|
|album| 专辑名|

**android_metadata:当前字符编码**|字段|解析|| ------------- |:-----||locale   |默认字符编码,例如 zh_CN|**artists:艺术家**|字段|解析|| ------------- |:-----||artist_id|  主键。艺术家 id||artist_key|  全大写字母,用于字母索引||artist    |艺术家|**audio_genres:流派**|字段|解析|| ------------- |:-----||_id |主键。流派 id||name |流派名称|**audio_genres_map:音频流派映射**|字段|解析|| ------------- |:-----||字段 |解析||_id    |主键。映射 id||audio_id|    音频 id||genre_id|流派 id|**audio_meta:音频信息**|字段|解析|| ------------- |:-----||_id    |主键。音频 id||_data    |文件绝对路径||_display_name  |文件名||_size |文件大小,单位 byte||mime_type    |类似于 audio/mpeg 的 MIME 类型||date_added   |添加到数据库的时间,单位秒||date_modified   |文件最后修改时间,单位秒||title    |来自 ID3 信息的标题,无则为不带扩展名的文件名||title_key|  全大写字母的标题||duration  |时长||artist_id  |艺术家 id||composer   |来自 ID3 信息,作曲家||album_id    |专辑 id||track   |来自 ID3 信息,音轨||year |来自 ID3 信息,年代||is_ringtone  |是否铃声,0 或 1||is_music   |是否音乐,1 才会在音乐播放器显示||is_alarm    |是否闹钟铃声||is_notification    |是否通知铃声||is_podcast |是否 podcast||bookmark   |字典标志位|**audio_playlists:播放列表**|字段|解析|| ------------- |:-----||_id  |主键。播放列表 id||_data  |文件路径||name |播放列表名||date_added  |加入的时间||date_modified   |最近修改的时间|**audio_playlists_map:音频播放列表映射**|字段|解析|| ------------- |:-----||_id    |主键。映射 id||audio_id |音频 id||playlist_id |播放列表 id||play_order    |播放顺序|  为了消除数据冗余,建议了进行映射的表。假如有大量音频属于同一流派,如果没有映射表则需要每个音频都需要记录同样的流派数据,有了映射表之后则只有一条记录就够了。##3.2 图片  图片的表主要有两个,images和thumbnails,对应的是图片信息和略缩图信息。其物理模型如下图所示:![这里写图片描述](http://upload-images.jianshu.io/upload_images/1819426-67967e0e6a3b941b?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)**images:图片信息**|字段|解析|| ------------- |:-----||_id   |主键。图片 id,从 1 开始自增||_data   |图片绝对路径||_size  |文件大小,单位为 byte||_display_name   |文件名||mime_type |类似于 image/jpeg 的 MIME 类型||title    |不带扩展名的文件名||date_added  |添加到数据库的时间,单位秒||date_modified   |文件最后修改时间,单位秒||description  |文件的描述||picasa_id   |用于 picasa 网络相册||isprivate  |是否是私有的||latitude   |纬度,需要照片有 GPS 信息||longitude |经度,需要照片有 GPS 信息||datetaken |取自 EXIF 照片拍摄时间,若为空则等于文件修改时间,单位毫秒||orientation  |取自 EXIF 旋转角度,在图库旋转图片也会改变此值||mini_thumb_magic   |取小缩略图时生成的一个随机数,见 MediaThumbRequest||bucket_id  |等于 path.toLowerCase.hashCode(),见 MediaProvider.computeBucketValues()||bucket_display_name  |直接包含图片的文件夹就是该图片的 bucket,就是文件夹名|**thumbnails:缩略图**|字段|解析|| ------------- |:-----||_id   |主键。缩略图 id,从 1 开始自增||_data  |图片绝对路径||image_id   |缩略图所对应图片的 id,依赖于 images 表 _id 字段,可建立外键||kind   |缩略图类型,1 是大缩略图,2 基本不用,3 是微型缩略图但其信息不保存在数据库||width    |缩略图宽度||height  |缩略图高度|##3.3 视频  视频的表主要有两个,video和videothumbnails,对应的是视频信息和略缩图信息。其物理模型如下图所示:![这里写图片描述](http://upload-images.jianshu.io/upload_images/1819426-e912814a78ef6628?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)**video:视频信息**|字段|解析|| ------------- |:-----||_id   |主键。视频 id||_data    |视频绝对路径||_display_name| 文件名||_size  |文件大小,单位为 byte||mime_type   |类似于 video/avi 的 MIME 类型||date_added    |添加到数据库的时间,单位秒||date_modified   |文件最后修改时间,单位秒||title    |不带扩展名的文件名||duration    |视频时长,单位毫秒||artist  |艺术家||album |专辑名,一般为文件夹名||resolution    |分辨率||description   |描述||isprivate  |是否是私有的||tags   |标签||category   |类别||language   |语言||mini_thumb_data    |最小的略缩图数据||latitude |经度||longitude  |维度||datetaken  |数据的标识||mini_thumb_magic    |取小缩略图时生成的一个随机数,见 MediaThumbRequest||bucket_id  |等于 path.toLowerCase.hashCode(),见 MediaProvider.computeBucketValues()||bucket_display_name| 直接包含视频的文件夹就是该图片的 bucket,就是文件夹名||bookmark    |字典的标识|**videothumbnails:视频缩略图**|字段|解析|| ------------- |:-----||_id |主键。缩略图 id||_data   |缩略图绝对路径||video_id  |缩略图所对应视频的 id,依赖于 video 表 _id 字段||kind  |缩略图类型,1 是大图,视频只能取类型 1||width   |缩略图宽度||height  |缩略图高度|
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,670评论 5 460
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,928评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,926评论 0 320
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,238评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,112评论 4 356
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,138评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,545评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,232评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,496评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,596评论 2 310
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,369评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,226评论 3 313
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,600评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,906评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,185评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,516评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,721评论 2 335

推荐阅读更多精彩内容