2018年写过tf保存为pb使用tfserving,现在发现tf2.0环境运行不了了,于是重新研究下官方例子[https://github.co...
规律:第一个返回left 最后一个返回right,第一个题目有等号比较就有等号,最后一个题目有等号比较就没等号 理解:因为最后的跳出条件是sta...
最近看到推送,百度的开源词法LAC2.0发布了,可增量训练适应自己的数据, 赶紧来试验下。git 模型是两层的BI-GRU+CRF,隐藏层维度2...
NLPCC2020的任务三 考虑噪音标注以及不全标注信息的情况下来构造信息抽取系统。当给定实体类别,实体的一个列表,还有大量未标注语料时,我们如...
轻量化网络,在实际上最有效。 全连接网络里,多加一层,参数变少,相当于中间压缩了。 每个通道有个核,对应卷积,再使用1×1卷积核,融合不同通道的...
用更少的bit来存参数,(例如32个bit改成16个bit) 把参数分群,用更少的bit来代表参数 通过霍夫曼编码,把出现频率高的值用更少的bi...
先训练一个大模型,再训练一个小模型学习大模型的输出。 大模型不仅学到了类别,还学到了类别之间相似的东西,比真实label更多信息,不知告诉这个图...
李宏毅 network compression https://www.youtube.com/watch?v=dPp8rCAnU_A 因为现在...
记一个找了一整天的bug。keras-contrib 里面的crf loss 因为CRF层定义的时候 self.crf = CRF(self.n...