PMAN2

分類 学位論文・卒論・特別研究
Author(s)/ 著者名 鷲尾 巧
Key/ キー
Title/ 表題 クラスタリングを用いた作業履歴の目的分類
Month/ 刊行月 March
Year/ 出版年 2019
Note/ 付加情報
Annote/ 注釈
Abstract/ 内容梗概 ソフトウェア開発者の能力向上や開発プロセスの改善をするための手法であるPersonal Software Process が 提唱されている.
PSPはソフトウェア開発者の作業履歴を記録し,実装やテスト,設計,会議といった個々の開発工程にどれだけの時間を費やしているかを分析し,効率の改善やプロセスの改善に役立てる手法である.
そこで,PSP での作業履歴計測を支援するためのツールである TaskPit がある.
先行研究で大橋らはTaskPitによって計測された作業履歴を用いてその前後の情報からその作業がどういった目的で行われているかを推定する手法を提案した.
これまで行われていた手法では何日分かの作業を先に計測して機械学習で学習させてから開発作業の自動推定を行っていた.
事前に学習が必要となると開発作業の途中でのプロセスの改善や開発作業の初期の段階でのPSPが行えない.
そこで本研究ではクラスタリングを用いてあるアプリケーションを使用している場合の作業名と作業時間,打鍵数,左右クリック数などをもとに作業目的が同一の作業群を推定する手法を提案する.
クラスタリングは教師なしの機械学習アルゴリズムなので,クラスタリングを用いることで事前学習なしで作業目的を推定することができる.
クラスタリングを用いて作業を行っている目的(実装や設計)をクラスタごとに分類し,後作業として各作業に作業目的をラベル付けする手法を提案する.
さらに,クラスタリングでは計測される作業量(クリック数や打鍵数)のうち,どれが分類に重要であるかを確認した.
提案手法では,大橋らが使用したデータと同じデータを使用する.
その計測された作業履歴から,作業の順序関係を特徴として用いることができるように処理を施し,文字列データをクラスタリングでも使えるようにダミー変数を用いる.
最後に,処理を施した作業履歴データをクラスタリングに使う.
クラスタリングを行ったデータと正解データを照らし合わせて各クラスタにどの程度ばらつきがあるかをエントロピーを用いて確認する.
実験は,5名の被験者の5日分の作業履歴を用いた.
各被験者ごとにクラスタに分類し,各クラスタのエントロピーをだす,次にそのエントロピーすべての平均をだし,最後に被験者全員のエントロピーの平均をだして評価する.

実験の結果,右クリック数を分類に用いないほうが分類精度が上がることが分かった.
また,クラスタ数をふやすことで後作業が増えるが分類の精度を上げることができた.
論文電子ファイル


[9-44]  鷲尾 巧, クラスタリングを用いた作業履歴の目的分類, 2019.

@misc{9_44,
    author = {鷲尾 巧}, 
    title = {クラスタリングを用いた作業履歴の目的分類}, 
    month = {March},
    year = {2019},
    note = {},
    annote = {}
}

This site is maintained by Hidetake Uwano.
PMAN 2.1 - paper management system / (C) 2002-2003, o.mizuno@computer.org / All rights reserved.