<?xml version="1.0" encoding="utf-8"?>
<feed xmlns="http://www.w3.org/2005/Atom">
  <title>自然语言处理的技巧</title>
  
  <subtitle>公子小明的博客</subtitle>
  <link href="/atom.xml" rel="self"/>
  
  <link href="https://hongkg.cn/"/>
  <updated>2021-09-05T12:22:00.000Z</updated>
  <id>https://hongkg.cn/</id>
  
  <author>
    <name>公子小明</name>
    
  </author>
  
  <generator uri="https://hexo.io/">Hexo</generator>
  
  <entry>
    <title>python常用的读取文件程序</title>
    <link href="https://hongkg.cn/2021/09/05/python%E5%B8%B8%E7%94%A8%E7%9A%84%E8%AF%BB%E5%8F%96%E6%96%87%E4%BB%B6%E7%A8%8B%E5%BA%8F/"/>
    <id>https://hongkg.cn/2021/09/05/python%E5%B8%B8%E7%94%A8%E7%9A%84%E8%AF%BB%E5%8F%96%E6%96%87%E4%BB%B6%E7%A8%8B%E5%BA%8F/</id>
    <published>2021-09-05T12:22:00.000Z</published>
    <updated>2021-09-05T12:22:00.000Z</updated>
    
    <summary type="html">
    
      &lt;h1 id=&quot;python常用的读取文件操作&quot;&gt;&lt;a href=&quot;#python常用的读取文件操作&quot; class=&quot;headerlink&quot; title=&quot;python常用的读取文件操作&quot;&gt;&lt;/a&gt;python常用的读取文件操作&lt;/h1&gt;&lt;p&gt;python读取和保存csv、pkl、json、numpy等文件
    
    </summary>
    
    
      <category term="Python" scheme="https://hongkg.cn/categories/Python/"/>
    
    
      <category term="Python" scheme="https://hongkg.cn/tags/Python/"/>
    
  </entry>
  
  <entry>
    <title>C++虚函数表</title>
    <link href="https://hongkg.cn/2021/09/05/C-%E8%99%9A%E5%87%BD%E6%95%B0%E8%A1%A8/"/>
    <id>https://hongkg.cn/2021/09/05/C-%E8%99%9A%E5%87%BD%E6%95%B0%E8%A1%A8/</id>
    <published>2021-09-05T07:20:00.000Z</published>
    <updated>2021-09-05T07:20:00.000Z</updated>
    
    <summary type="html">
    
      &lt;h1 id=&quot;c-虚函数表&quot;&gt;&lt;a href=&quot;#c-虚函数表&quot; class=&quot;headerlink&quot; title=&quot;c++ 虚函数表&quot;&gt;&lt;/a&gt;c++ 虚函数表&lt;/h1&gt;&lt;p&gt;在c++中，实现多态有多种方式，其中动态多态的核心就是&lt;strong&gt;虚函数表&lt;/strong&gt;。每一个拥有虚函数的类，都有一个虚函数表。
    
    </summary>
    
    
      <category term="C++" scheme="https://hongkg.cn/categories/C/"/>
    
    
      <category term="C++" scheme="https://hongkg.cn/tags/C/"/>
    
      <category term="虚函数" scheme="https://hongkg.cn/tags/%E8%99%9A%E5%87%BD%E6%95%B0/"/>
    
  </entry>
  
  <entry>
    <title>大数据学习2——HDFS原理学习</title>
    <link href="https://hongkg.cn/2021/02/12/%E5%A4%A7%E6%95%B0%E6%8D%AE%E5%AD%A6%E4%B9%A02%E2%80%94%E2%80%94HDFS%E5%8E%9F%E7%90%86%E5%AD%A6%E4%B9%A0/"/>
    <id>https://hongkg.cn/2021/02/12/%E5%A4%A7%E6%95%B0%E6%8D%AE%E5%AD%A6%E4%B9%A02%E2%80%94%E2%80%94HDFS%E5%8E%9F%E7%90%86%E5%AD%A6%E4%B9%A0/</id>
    <published>2021-02-12T14:13:00.000Z</published>
    <updated>2021-02-12T14:13:00.000Z</updated>
    
    <summary type="html">
    
      &lt;p&gt;在上一篇博客中，我们已经搭建了一个Hadoop集群，这里开始学习HDFS的基本原理。
    
    </summary>
    
    
      <category term="大数据" scheme="https://hongkg.cn/categories/%E5%A4%A7%E6%95%B0%E6%8D%AE/"/>
    
    
      <category term="大数据" scheme="https://hongkg.cn/tags/%E5%A4%A7%E6%95%B0%E6%8D%AE/"/>
    
      <category term="Hadoop" scheme="https://hongkg.cn/tags/Hadoop/"/>
    
      <category term="HDFS" scheme="https://hongkg.cn/tags/HDFS/"/>
    
  </entry>
  
  <entry>
    <title>大数据学习1——Hadoop完全分布式搭建</title>
    <link href="https://hongkg.cn/2021/02/01/%E5%A4%A7%E6%95%B0%E6%8D%AE%E5%AD%A6%E4%B9%A01%E2%80%94%E2%80%94Hadoop%E5%AE%8C%E5%85%A8%E5%88%86%E5%B8%83%E5%BC%8F%E6%90%AD%E5%BB%BA/"/>
    <id>https://hongkg.cn/2021/02/01/%E5%A4%A7%E6%95%B0%E6%8D%AE%E5%AD%A6%E4%B9%A01%E2%80%94%E2%80%94Hadoop%E5%AE%8C%E5%85%A8%E5%88%86%E5%B8%83%E5%BC%8F%E6%90%AD%E5%BB%BA/</id>
    <published>2021-02-01T10:13:00.000Z</published>
    <updated>2021-02-01T10:13:00.000Z</updated>
    
    <summary type="html">
    
      &lt;p&gt;学大数据第一件事就是搭建一个Hadoop集群。这里尝试了两种搭建方式。第一种是使用云服务器搭建。第二种是在虚拟机里面使用Ubuntu18搭建。
    
    </summary>
    
    
      <category term="大数据" scheme="https://hongkg.cn/categories/%E5%A4%A7%E6%95%B0%E6%8D%AE/"/>
    
    
      <category term="大数据" scheme="https://hongkg.cn/tags/%E5%A4%A7%E6%95%B0%E6%8D%AE/"/>
    
      <category term="Hadoop" scheme="https://hongkg.cn/tags/Hadoop/"/>
    
      <category term="HDFS" scheme="https://hongkg.cn/tags/HDFS/"/>
    
      <category term="Yarn" scheme="https://hongkg.cn/tags/Yarn/"/>
    
  </entry>
  
  <entry>
    <title>信息抽取之事件抽取</title>
    <link href="https://hongkg.cn/2020/10/11/%E4%BF%A1%E6%81%AF%E6%8A%BD%E5%8F%96%E4%B9%8B%E4%BA%8B%E4%BB%B6%E6%8A%BD%E5%8F%96/"/>
    <id>https://hongkg.cn/2020/10/11/%E4%BF%A1%E6%81%AF%E6%8A%BD%E5%8F%96%E4%B9%8B%E4%BA%8B%E4%BB%B6%E6%8A%BD%E5%8F%96/</id>
    <published>2020-10-11T09:28:00.000Z</published>
    <updated>2020-10-11T09:28:00.000Z</updated>
    
    <summary type="html">
    
      &lt;p&gt;本文是接前面两篇文章&lt;a href=&quot;https://www.hongkg.cn/2020/10/11/%E4%BF%A1%E6%81%AF%E6%8A%BD%E5%8F%96%E4%B9%8B%E5%85%B3%E7%B3%BB%E6%8A%BD%E5%8F%96/&quot; target=&quot;_blank&quot; rel=&quot;noopener&quot;&gt;信息抽取之关系抽取&lt;/a&gt;和&lt;a href=&quot;https://www.hongkg.cn/2020/10/08/%E4%BF%A1%E6%81%AF%E6%8A%BD%E5%8F%96%E4%B9%8B%E5%AE%9E%E4%BD%93%E6%8A%BD%E5%8F%96/&quot; target=&quot;_blank&quot; rel=&quot;noopener&quot;&gt;信息抽取之实体抽取&lt;/a&gt;，继续探讨信息抽取中的事件抽取。
    
    </summary>
    
    
      <category term="信息抽取" scheme="https://hongkg.cn/categories/%E4%BF%A1%E6%81%AF%E6%8A%BD%E5%8F%96/"/>
    
    
      <category term="信息抽取" scheme="https://hongkg.cn/tags/%E4%BF%A1%E6%81%AF%E6%8A%BD%E5%8F%96/"/>
    
      <category term="事件抽取" scheme="https://hongkg.cn/tags/%E4%BA%8B%E4%BB%B6%E6%8A%BD%E5%8F%96/"/>
    
  </entry>
  
  <entry>
    <title>信息抽取之关系抽取</title>
    <link href="https://hongkg.cn/2020/10/11/%E4%BF%A1%E6%81%AF%E6%8A%BD%E5%8F%96%E4%B9%8B%E5%85%B3%E7%B3%BB%E6%8A%BD%E5%8F%96/"/>
    <id>https://hongkg.cn/2020/10/11/%E4%BF%A1%E6%81%AF%E6%8A%BD%E5%8F%96%E4%B9%8B%E5%85%B3%E7%B3%BB%E6%8A%BD%E5%8F%96/</id>
    <published>2020-10-11T09:16:00.000Z</published>
    <updated>2020-10-11T09:16:00.000Z</updated>
    
    <summary type="html">
    
      &lt;p&gt;本文是接上一篇文章&lt;a href=&quot;https://www.hongkg.cn/2020/10/08/%E4%BF%A1%E6%81%AF%E6%8A%BD%E5%8F%96%E4%B9%8B%E5%AE%9E%E4%BD%93%E6%8A%BD%E5%8F%96/&quot; target=&quot;_blank&quot; rel=&quot;noopener&quot;&gt;信息抽取之实体抽取&lt;/a&gt;，继续探讨信息抽取中的关系抽取。另有&lt;a href=&quot;https://www.hongkg.cn/2020/10/11/%E4%BF%A1%E6%81%AF%E6%8A%BD%E5%8F%96%E4%B9%8B%E4%BA%8B%E4%BB%B6%E6%8A%BD%E5%8F%96/&quot; target=&quot;_blank&quot; rel=&quot;noopener&quot;&gt;信息抽取之事件抽取&lt;/a&gt;&lt;br&gt;
    
    </summary>
    
    
      <category term="信息抽取" scheme="https://hongkg.cn/categories/%E4%BF%A1%E6%81%AF%E6%8A%BD%E5%8F%96/"/>
    
    
      <category term="信息抽取" scheme="https://hongkg.cn/tags/%E4%BF%A1%E6%81%AF%E6%8A%BD%E5%8F%96/"/>
    
      <category term="关系抽取" scheme="https://hongkg.cn/tags/%E5%85%B3%E7%B3%BB%E6%8A%BD%E5%8F%96/"/>
    
  </entry>
  
  <entry>
    <title>信息抽取之实体抽取</title>
    <link href="https://hongkg.cn/2020/10/08/%E4%BF%A1%E6%81%AF%E6%8A%BD%E5%8F%96%E4%B9%8B%E5%AE%9E%E4%BD%93%E6%8A%BD%E5%8F%96/"/>
    <id>https://hongkg.cn/2020/10/08/%E4%BF%A1%E6%81%AF%E6%8A%BD%E5%8F%96%E4%B9%8B%E5%AE%9E%E4%BD%93%E6%8A%BD%E5%8F%96/</id>
    <published>2020-10-08T03:00:00.000Z</published>
    <updated>2020-10-08T03:00:00.000Z</updated>
    
    <summary type="html">
    
      &lt;p&gt;本文主要探讨非结构化数据的信息抽取方法，后续相关文章还有&lt;a href=&quot;https://www.hongkg.cn/2020/10/11/%E4%BF%A1%E6%81%AF%E6%8A%BD%E5%8F%96%E4%B9%8B%E5%85%B3%E7%B3%BB%E6%8A%BD%E5%8F%96/&quot; target=&quot;_blank&quot; rel=&quot;noopener&quot;&gt;信息抽取之实体抽取&lt;/a&gt;，&lt;a href=&quot;https://www.hongkg.cn/2020/10/11/%E4%BF%A1%E6%81%AF%E6%8A%BD%E5%8F%96%E4%B9%8B%E4%BA%8B%E4%BB%B6%E6%8A%BD%E5%8F%96/&quot; target=&quot;_blank&quot; rel=&quot;noopener&quot;&gt;信息抽取之事件抽取&lt;/a&gt;&lt;br&gt;
    
    </summary>
    
    
      <category term="信息抽取" scheme="https://hongkg.cn/categories/%E4%BF%A1%E6%81%AF%E6%8A%BD%E5%8F%96/"/>
    
    
      <category term="信息抽取" scheme="https://hongkg.cn/tags/%E4%BF%A1%E6%81%AF%E6%8A%BD%E5%8F%96/"/>
    
      <category term="实体抽取" scheme="https://hongkg.cn/tags/%E5%AE%9E%E4%BD%93%E6%8A%BD%E5%8F%96/"/>
    
  </entry>
  
  <entry>
    <title>百度百科词条爬虫</title>
    <link href="https://hongkg.cn/2020/06/18/%E7%99%BE%E5%BA%A6%E7%99%BE%E7%A7%91%E8%AF%8D%E6%9D%A1%E7%88%AC%E8%99%AB/"/>
    <id>https://hongkg.cn/2020/06/18/%E7%99%BE%E5%BA%A6%E7%99%BE%E7%A7%91%E8%AF%8D%E6%9D%A1%E7%88%AC%E8%99%AB/</id>
    <published>2020-06-18T07:58:49.000Z</published>
    <updated>2020-06-18T07:58:49.000Z</updated>
    
    <summary type="html">
    
      &lt;p&gt;最近在做一些信息抽取方面的研究，但是苦于没有中文语料。于是想到了百度百科，从百度百科的词条里的文字，生成一些语料。需要的是非结构化的数据，所以爬取百度百科的描述性的语句，而不是已经结构化的那些标签。&lt;br&gt;
    
    </summary>
    
    
    
  </entry>
  
  <entry>
    <title>Python小技巧</title>
    <link href="https://hongkg.cn/2020/06/18/Python%E5%B0%8F%E6%8A%80%E5%B7%A7/"/>
    <id>https://hongkg.cn/2020/06/18/Python%E5%B0%8F%E6%8A%80%E5%B7%A7/</id>
    <published>2020-06-18T07:35:00.000Z</published>
    <updated>2020-06-18T07:35:00.000Z</updated>
    
    <summary type="html">
    
      &lt;p&gt;自动生成requirements;&lt;/p&gt;
    
    </summary>
    
    
      <category term="Python" scheme="https://hongkg.cn/categories/Python/"/>
    
    
      <category term="Python" scheme="https://hongkg.cn/tags/Python/"/>
    
  </entry>
  
  <entry>
    <title>Alicoco:阿里巴巴电子商务认知概念图谱的半自动构建</title>
    <link href="https://hongkg.cn/2020/05/31/Alicoco-%E9%98%BF%E9%87%8C%E5%B7%B4%E5%B7%B4%E7%94%B5%E5%AD%90%E5%95%86%E5%8A%A1%E8%AE%A4%E7%9F%A5%E6%A6%82%E5%BF%B5%E5%9B%BE%E8%B0%B1%E7%9A%84%E5%8D%8A%E8%87%AA%E5%8A%A8%E6%9E%84%E5%BB%BA/"/>
    <id>https://hongkg.cn/2020/05/31/Alicoco-%E9%98%BF%E9%87%8C%E5%B7%B4%E5%B7%B4%E7%94%B5%E5%AD%90%E5%95%86%E5%8A%A1%E8%AE%A4%E7%9F%A5%E6%A6%82%E5%BF%B5%E5%9B%BE%E8%B0%B1%E7%9A%84%E5%8D%8A%E8%87%AA%E5%8A%A8%E6%9E%84%E5%BB%BA/</id>
    <published>2020-05-31T02:13:00.000Z</published>
    <updated>2020-05-31T02:13:00.000Z</updated>
    
    <summary type="html">
    
      &lt;p&gt;AliCoCo: Alibaba E-commerce Cognitive Concept Net.这是一篇领域知识图谱构建的文章，构建的是电商概念图谱。这篇文章介绍了Alicoco是怎么构建的，以及在电商领域是怎么应用的。&lt;br&gt;
    
    </summary>
    
    
      <category term="知识图谱" scheme="https://hongkg.cn/categories/%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1/"/>
    
      <category term="信息抽取" scheme="https://hongkg.cn/categories/%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1/%E4%BF%A1%E6%81%AF%E6%8A%BD%E5%8F%96/"/>
    
    
      <category term="知识图谱" scheme="https://hongkg.cn/tags/%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1/"/>
    
  </entry>
  
</feed>
