データサイエンティストハトリのブログ

PythonとインテリジェントクラウドとAIが好きな学生エンジニア。データ分析、スクレイピング、就職活動などについて書いていきます。

Unidic辞書を使って、文字を変換するプログラムを作った

f:id:hatorihatorihatorik:20180916030549p:plain

松尾研のサマースクールの影響で最近は、自然言語処理の勉強をしています。

 

Unidic辞書を使って、文字を変換するプログラムを作ったのでメモです。

 

import pandas as pd
import numpy as np

print("Please input a word")
search_word = input()

df = pd.read_csv("lex_ansi.csv", encoding='cp932', names=('a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u') )

 

input_word = df['a']
output_word = df['l']

i = 0
for word in input_word:
if word == search_word:
break
i += 1

print("This mean equal")
print(output_word[i])