Exploratoryでデータの加工から解析までノーコードで実行してみた

このエントリーをはてなブックマークに追加

Exploratoryはプログラミングをせずにデータを活用できるツールです。誰でも簡単に、データの加工、可視化、予測などの分析ができます。

今回はkaggleのタイタニック号のデータを使い、生存結果に対しての重要度を調べてみます。

まずは公式サイトから、アカウントを登録します。

「無料で試す!」をクリックします。

「Public」を選択します。

アカウント情報を入力して、「サインアップ」をクリックすると、メールが送信されます。

受信したメールからアカウントを有効化し、ログインするとExploratoryをダウンロードできます。

ダウンロードが完了したらアプリを開き、先ほど入力したアカウントでログインします。

「セットアップを開始」をクリックします。

セットアップが完了したら、プロジェクトの「新規作成」をクリックします。

プロジェクト名は「test」とします。

「データフレーム」をクリックし、「ファイルデータ」を選択します。

「テキストファイル」を選択します。

今回は「train.csv」「test.csv」を選択し、「インポート」をクリックします。

「全てをOK」をクリックします。

データのインポートが完了するとデータのサマリが表示されます。「Age」を見ると欠損値が多いことが確認できます。
Exploratoryでは、さまざまな種類のデータを加工できますが、今回は「Age」の欠損値を埋めてみます。「Age」の右にある下向きの矢印をクリックします。

「欠損値(NA)の加工」「欠損値を…で埋める」「平均値」を選択します。

何も変えずに「実行」をクリックします。

「欠損値」がなくなったことが確認できます。次に、「Survived」の結果と各データの関係をみます。

「アナリティクス」を選択します。

「タイプ」は「ランダムフォレスト」、「目的変数」は「Survived」、「予測変数」は「Survived」以外を全て選択し、「実行」をクリックします。

無事、「Survived」の重要度が確認できました。

最後に

今回はExploratoryを使って、データの分析をしました。Exploratoryでは、データの分析をした後にも、作成したチャートやアナリティクスをダッシュボードに追加することで、他の人と共有もでき非常に便利だと思うので、ぜひ試してみてください。