近刊検索 デルタ

2018年8月31日発売

朝倉書店

やってみようテキストマイニング

自由回答アンケートの分析に挑戦!
このエントリーをはてなブックマークに追加
内容紹介
アンケート調査の自由回答文を題材に,フリーソフトKH CoderとExcelを使ってテキストデータの定量分析に挑戦。テキストマイニングの勘所や流れがわかる入門書。〔内容〕分析の手順/データの事前編集/形態素解析/抽出語の分析/文書の分析/他
目次
第1章 テキストマイニングをはじめる
 1.1 テキストマイニングとは 
 1.2 テキストマイニングの手順
  1.2.1 「文書」を「言葉」にばらす――形態素解析
  1.2.2 「言葉」と「言葉」の関係を分析する
 1.3 データ構造の特徴 
 1.4 テキストマイニングのポイント
  1.4.1 データ整理の段階
  1.4.2 検索や分析の段階
  1.4.3 解釈する段階――仮説を立てて要約する
 1.5 事例について 

第2章 データの事前編集
 2.1 外部変数とテキストデータ 
 2.2 有効データの抽出 
 2.3 データの置換 
 2.4 改行コードの編集 

第3章 データの読み込み
 3.1 データファイルの分割 
 3.2 テキスト部のデータの読み込みとファイル形式  
 3.3 前処理
  3.3.1 分析対象ファイルのチェック
  3.3.2 前処理の実行
 3.4 抽出語の暫定的なリスト表示 
 3.5 My辞書の作成
  3.5.1 複合語の検出とMy辞書の作成
  3.5.2 語の取捨選択
 3.6 前処理の再実行 
 3.7 外部変数の読み込み 

第4章 第1段階の分析1:抽出語の分析
 4.1 抽出語全体のリスト表示と集計
  4.1.1 [抽出語リスト]――抽出語を頻度順に並べる
  4.1.2 [記述統計]――抽出語の基本的な集計を行う
 4.2 抽出語のさまざまな検索
  4.2.1 [抽出語検索]――抽出語の詳細な情報を表示する
  4.2.2 [KWICコンコーダンス]――文脈内で抽出語を一覧する
  4.2.3 [関連語検索]――共起性に基づく関連語を検索する
 4.3 抽出語の分析
  4.3.1 共通の手続き:抽出語の選択と調整ボタン
  4.3.2 [対応分析]――クロス集計を視覚化する
  4.3.3 [多次元(構成)法]――抽出語どうしの共起関係を視覚化する
 4.3.4 [階層的クラスター分析]――似たものどうしをグループ化する
  4.3.5 [共起ネットワーク]――共起関係のネットワークを描写する
  4.3.6 [自己組織化マップ]――抽出語を自動分類する

第5章 第1段階の分析2:文書の分析
 5.1 [文書検索]――抽出語の組み合わせで文書を検索する
  5.1.1 検索条件の設定
  5.1.2 結果の表示方法
  5.1.3 文書(サンプル)の詳細表示
 5.2 [クラスター分析]――類似の回答をグループ化する
  5.2.1 クラスター分析のオプション設定
  5.2.2 クラスター別文書数と併合過程
  5.2.3 クラスター別文書検索と特徴後語の表示

第6章 第2段階の分析:仮説検証的な分析
 6.1 仮説をコーディングする
  6.1.1 仮説たてる
  6.1.2 仮説をコード化する
 6.2 仮説コードの集計と分析
  6.2.1 仮説コードの集計
  6.2.2 仮説コードの分析
 6.3 再び文書検索/コード化できなかった文書を追跡する 
 6.4 コーディング結果の出力と利用法 

第7章 テキストマイニングの事例
 7.1 高齢者向けサービスのまとめ 
 7.2 来街者による街の評価 
 7.3 週報データの分析 
 7.4 公的統計におけるコメントの分析 

付録A データ編集の補足
 A.1 Excelマクロによる一括変換 
 A.2 改行コードの編集 

付録B Excelマクロによる外部変数と抽出語のクロス集計
 B.1 クロス集計用Excelデータ 
 B.2 クロス集計の実行 
  B.2.1 データの貼りつけ
  B.2.2 集計指示表の作成と実行
  B.2.3 集計結果の表示
 B.3 「外部変数と見出し」の利用 
  B.3.1 外部変数の特定の値(カテゴリー)の特徴語
  B.3.2 外部変数の特徴語一覧

付録C ベイズ学習による分類
 C.1 ベイズの定理とテキストマイニングへの応用 
 C.2 外部変数からの学習 
 C.3 学習結果を用いた自動分類

索引

●コラム目次
 1 KH Coderについて 
 2 HTMLマーキング 
 3 抽出語に関する注意事項とKH Coderの品詞体系 
 4 共起性の尺度
 5 サブグラフ
著者略歴
牛澤 賢二(ウシザワ ケンジ)
統計科学研究所

※近刊検索デルタの書誌情報はopenBDのAPIを使用しています。

※近刊検索デルタの書誌情報はopenBDのAPIを利用しています。