機械学習で大事なことをミニgunosyをつくって学んだ╭( ・ㅂ・)و ̑̑
TRANSCRIPT
名前:高橋誠二 学歴:慶應経済4年 職種:エンジニア勤務3年 ライブラリ2つ自作して起業家に 関するデータ分析の卒論書いた。 Digital Founders Japan選抜。 7社インターン、新規開発・運用部 100名規模の人事評価制度設計。 エンジニアの海外コミュニティーサイト Casualyze.com運営経験。 Techlabpaakプロジェクト会員 Gunosyっぽいやつできた←New
twitter: @timadayon github: timakin
RubyでAPI接続と生データ抽出、形態素解析で単語分割、名詞のみ抽出、テキスト書き出し。Pythonでテキストから意味ある名詞とその意味の重要さ、登場頻度を考慮した特徴語抽出、特殊語の不要なものをさらにクリーニング、CSVに書き出し、特徴語を言語ベクトルに変換、言語ベクトルの次元圧縮、クラスタリング、予測モデルのトレーニング、結果のチューニング、クライアントツール化
・生データ抽出 ・名詞のみ抽出テキスト書き出し。 ・意味の重要さ、登場頻度を考慮 ・邪魔な単語を除外 ・互いの単語の関係を座標で表現 ・トピックごとにまとめる ・予測モデルのトレーニング ・結果を良くする ・クライアントツール化
・生データ抽出 ・名詞のみ抽出テキスト書き出し。 ・意味の重要さ、登場頻度を考慮 ・邪魔な単語を除外 ・互いの単語の関係を座標で表現 ・トピックごとにまとめる ・予測モデルのトレーニング ・結果を良くする ・クライアントツール化
・生データ抽出 ・名詞のみ抽出テキスト書き出し。 ・意味の重要さ、登場頻度を考慮 ・邪魔な単語を除外 ・互いの単語の関係を座標で表現 ・トピックごとにまとめる ・予測モデルのトレーニング ・結果を良くする ・クライアントツール化
・生データ抽出 ・名詞のみ抽出テキスト書き出し。 ・意味の重要さ、登場頻度を考慮 ・邪魔な単語を除外 ・互いの単語の関係を座標で表現 ・トピックごとにまとめる ・予測モデルのトレーニング ・結果を良くする ・クライアントツール化
Qunosy Personal Gunosy for Qiita With machine
learning, corpus clustering, recommend you the latest code that match your interest.
Qunosy adopt random forest as clustering method.
1. やりたいことを決める 2. 分析に必要なデータを調べる 3. 分析手法を決める 4. 手法にあったデータを抽出する 5. 適切な形にデータを加工する 6. (訓練データを作って学習) 7. 表示形式を整える
1. やりたいことを決める 2. 分析に必要なデータを調べる 3. 分析手法を決める 4. 手法にあったデータを抽出する 5. 適切な形にデータを加工する 6. (訓練データを作って学習) 7. 表示形式を整える
1. やりたいことを決める 2. 分析に必要なデータを調べる 3. 分析手法を決める 4. 手法にあったデータを抽出する 5. 適切な形にデータを加工する 6. (訓練データを作って学習) 7. 表示形式を整える
1. やりたいことを決める 2. 分析に必要なデータを調べる 3. 分析手法を決める 4. 手法にあったデータを抽出する 5. 適切な形にデータを加工する 6. (訓練データを作って学習) 7. 表示形式を整える
1. やりたいことを決める 2. 分析に必要なデータを調べる 3. 分析手法を決める 4. 手法にあったデータを抽出する 5. 適切な形にデータを加工する 6. (訓練データを作って学習) 7. 表示形式を整える