240 发简信
IP属地:重庆
  • 120
    机器学习常见评价指标

    在机器学习或深度学习中,评价指标是衡量一个模型效果好与坏的标准。本文主要介绍一些常用的评价指标,包含:准确率(accuary)、精准率、召回率、F1值、PR曲线、ROC曲线、...

  • 120
    Bert如何使用预留的[unused*]

    背景 在使用Bert进行文本分析的过程中,我们需要用BERT自带的分词器(Tokenizer)来对文本序列进行分词(Tokenize),其基本原理是基于BERT自带的词典文件...

  • 120
    [python] spacy

    基本上所有的NLP的任务都可以完成,是一个不得不学的库。 Spacy功能简介 可以用于进行分词,命名实体识别,词性识别等等,但是首先需要下载预训练模型 sentencizer...

  • 02.数据预处理之清洗文本信息

    准备30万条新闻数据 编号新闻类别新闻数量(条)1财经370982教育419633科技655344时政630865体育655346娱乐65534 链接: https://pa...

  • Conda无法安装或更新的问题

    用conda安装任何东西都报错. 开始怀疑是公司的鬼网络问题. 将.condarc重命名, 重新尝试, 一切又很正常, 以为是清华源TUNA的问题, 还想去https://g...

  • setuptools详解

    Python包管理工具setuptools详解 前言:这篇是别人写的,我这边只是记录下,以后查资料的时候,更方便。 0.什么是setuptools setuptools是Py...

  • 120
    彻底搞懂Python切片操作

    写在前面: 利用python解决问题的过程中,经常会遇到从某个对象中抽取部分值的情况。“切片”操作正是专门用于实现这一目标的有力武器。理论上,只要条件表达式得当,可以通过单次...