动漫妹子分类

这是我闲来无事做的一个小项目,根据输入的动漫女性图片,可以判断女性的类别,暂时只是大概做了三类:萝莉,御姐,成熟女性。如果你们感兴趣的话,可以添加更多的分类,比如黑长直,金发等,当然也可以是隐藏属性等等,比如天然呆,傲娇,腹黑,病娇等等,当然做到这些需要你好好的准备数据集。

数据集

我的数据集其实没有花太多时间,简单的用爬虫爬取百度图片,三种类型,其中前两种比较好爬,爬取完后进行筛选,去除背景较大的,尽量让人物填满整个图片,当然如果你有心的话,可以手动截取,去除多余的背景,我每一类只留下了50张图片,所以截取工作量也能接受。
当然你如果想获得更好的效果,就需要更多的数据。第三类图片爬取成熟女性的动漫角色的话,出来的基本都是很奇妙的东西。。我试了下爬取K站的图,也都是不太合适的图片,因此我不得不手动从百度图片找,大致让我满意的就找了30张。。也懒得再找了,就这样吧。(真的是懒)

PS:因为动漫角色不是人脸和真实物体,所以我暂时不太清楚有什么办法可以程序式的识别出图片中的角色,如果是人脸的话,有很多的程序方法可以直接将人脸从图片中扣出。所以稳妥点还是手动截取角色吧,但是我比较懒2333我直接用了爬虫爬取后的图片,然后简单筛选一下,留下50张,之后我会上传到百度云盘。所以我这个数据集不管在数量还是质量上都是很差的,你们有很大的提升空间

Add:数据集下载 提取码:2nw9 考虑到墙的原因,就不适用GoogleDrive了。

数据增强

要训练神经网络,一共130张图片肯定是不够的,因此需要数据增强。我提供了一些利用PIL模块数据增强的方法,放在了process.py中,你们可以自行修改,也可以直接用。

最后我增强到了1040张图片,勉勉强强合格了。

训练

训练相关的配置都在Config中:

class Config(object):
    model_saved_path='checkpoints/anime_type.pkl'
    train_path='data/'
    img_size = 128
    batch_size=20
    shuffle = True
    num_workers = 2
    lr=1e-3
    use_gpu=False
    epoch = 20
    test_img = 'test/luo1.jpg'

你们可以根据实际情况进行修改。我这里只训练了20轮,又因为图片数量不大,所以只用了10分钟不到就训练好了,因此我就不给出checkpoints文件了,你们可以修改配置,增加epoch,制作更大更好的数据集,这样效果会更好。

结果

尽管我的数据集不是很好,训练时间也很短,但是效果却还可以,我测试了几张图片基本都可以准确分类。

luo5.jpg

测试输出:这个妹子是: 萝莉

luo6.jpg

测试输出:这个妹子是: 萝莉

yu3.jpg

测试输出:这个妹子是: 御姐

yu4.jpg

测试输出:这个妹子是: 御姐

yu6.jpg

测试输出:这个妹子是: 御姐

shu1.jpg

测试输出:这个妹子是: 成熟女性

shu2.jpg

测试输出:这个妹子是: 成熟女性

emmmm,你问我成熟女性和御姐有啥区别?? emmmm,我也没看出来,只能交给百度了,搜索御姐出来的图片我都认为是御姐了,搜索成熟女性出来的图片,我就认为为是成熟女性了。。上面最后两个在百度眼里的确就是成熟女性,可能成熟女性不一定是要结过婚的吧hhhhhh

或者是我的分类不太明确,你们可以做数据集的时候设置更分明的分类。

当然也有错误分类的,比如下面这张:

yu1.jpg

测试输出:这个妹子是: 萝莉

。。。。What?
timg.jpg

不过这也没办法,在这个不怎么样的数据集上,只训练了几分钟就有这个效果我已经很满意了。。不过话说这个妹子是不是颜艺之渊的学生会长?

完整的代码在我的github上,喜欢的可以点个Star,我后续会更新更多的分类,和完善数据集,搞数据集确实蛮累的=-=

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,529评论 5 475
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,015评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,409评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,385评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,387评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,466评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,880评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,528评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,727评论 1 295
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,528评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,602评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,302评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,873评论 3 306
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,890评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,132评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,777评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,310评论 2 342

推荐阅读更多精彩内容