Classification Project of Pokemon Dataset

This project was done in November 2017. The methods used may be outdated.

I don't know why it always automatically gets pushed to the top of my website:)

Abstract

In this project, I use the P......

自从有了GPT-2,妈妈再也不用担心我的学习

今年二月,GOOGLE发布了最新的语言模型GPT-2以及配套的论文。论文的主要思想是,只要有足够大的语料库以及模型,无监督的语言模型(Language Model)能够自发地推断(infer)和学习各种语言任务,比如文本生成,问答系统,翻译,代写作业......也就是说,只要预训练的数据集和模型体量(层数,参数量)够大,在完成预训练后,我们只要在输入的数据中提供一些目标任务的范式,比如用问答的形式......

NLP 系列之一:用 Trigram 进行 Article Spinner

Article Spinner 指文章的制作者通过改写文章的部分段落,或者用相似内容替换文中词汇,句子甚至段落来批量制造内容相近文章的技术。Article Spinner 主要运用在Search Engine Optimization(SEO)中,可以在批量生成近似内容的同时,有效降低文章的相似度来避开搜索引擎对重复内容的惩罚。换句话说,有了这个方法,站长再也不用为了SEO把一个关键词用看不见的颜......