\キノコードが作ったプログラミング学習 サービス登場/
学んだ知識をその場でアウトプットできるからスキルの定着が実感できる
Python学習といえば、キノクエスト!
・問題数は充実の350問以上
・環境構築は不要!
・カリキュラムがあるので学習方法に迷わない
▼登録はこちら▼
https://kino-code.com/kq_service_a/?utm_source=youtube.com&utm_medium=referral&utm_campaign=ubJohq5feeY_gaiyou
ーーー
この動画では、Pandasの使い方について説明します。初心者の方でもわかりやすいように丁寧な解説を心がけました。目次は下記になります。
▼目次
00:00 はじめに
01:03 Pandasとは
03:34 DataFrameとSeries
04:10 Pandasをインポート
04:43 ファイルの説明
05:34 csvファイルを読み取る
07:18 表示する列数・行数を変更する
09:58 最後の10行とってくる
10:08 ランダムに10行とってくる
10:21 データフレームの情報を取得する
10:46 統計量を取得する
12:10 グループごとに集計をする
12:43 並び替えをする
13:09 結合をする
14:44 グラフ化
15:42 時系列データ
▼自己紹介
現在:フリーランス(マーケティング関連の人工知能開発、データ分析や業務自動化など)
前職:リクルート
▼SNS
Twitter : https://twitter.com/kino_code/likes
Facebook :https://www.facebook.com/%E3%82%AD%E3%83%8E%E3%82%B3%E3%83%BC%E3%83%89-105693727500005/
▼文字書き起こし
Pandas超入門コースのコース紹介のところで、Pandasでは、PythonでExcelやcsv操作、グラフ化、データ集計や加工など人工知能開発の技術などができるとお伝えしました。
ただ、これだけでは、どんなことができるのかイメージができていない方がいらっしゃるかと思います。
そのため、この動画では、Pandasとはなんなのか?Pandasではどんなことができるのか?Pandasはどうやって使うのか?ということをザッと説明していきます。
この動画で紹介したワザは、のちのレッスンで詳しく説明をします。
したがって、今はこれから学ぶことを把握したり、Pandasはこうやって使うんだーと思いながら動画をご視聴ください。
とにかく、Pandasは、非常に便利です。
Pythonと組み合わせればデータ処理でできないことはないといっても過言ではないです。
また、プログラミング言語なので自動化することもできます。Pandasを覚えれば面倒な作業を卒業できるかもしれません。
ご自身での仕事や日常生活への活用シーンをイメージしながらご視聴していただけるとモチベーションがよりあがるかもしれません。
このチャンネルでは、PythonやPandasのレッスン動画、他にも、Pythonを使っての業務効率化や完全自動化などの動画をどんどん配信していきます。
新しい動画が更新されたときに新着通知がいくように、また、復習をする時に動画がどこにいったかわからなくならないようにチャンネル登録をお願いします。
それではレッスンを進めていきます。
Pandasとは、データ解析を支援する機能を提供するPythonのライブラリです。
例えば、Pandasには、csvファイルを読み取るための機能、Excelのデータを読み取る機能、列や行を削除したり、計算したり、フィルターをかけて抽出をしたり、グループごとにとまめたり、表同士をデータをつっつけたり、穴が空いているデータを色々な方法で埋めたり、時系列のデータを扱ったり、グラフ化をしたり。
本当に色々なことができます。
Excelでできることはほぼできますし、データベース言語のSQLでできることもほぼできます。個人的な感覚だと、それら以上にできることがあります。
また、人工知能開発では、事前のデータ処理、つまりデータの前処理が人工知能開発の8割以上になると言われています。
その前処理は、Pandasが使われることが多いです。
したがって、Pandasができるようになると、エクセル操作などの日々の業務の効率化、人工知能開発まで色々なことができるようになります。
このPandasで扱うデータ構造には、データフレームとシリーズの2つがあります。
データフレームとは、エクセルの表形式のように、列と行で成り立っているイメージです。
シリーズとは、データフレームから1列取り出した時にできる型でもあり、Pythonでいうリストのようなものにインデックスというものがくっついているイメージです。
Pandasといえばデータフレームがメインですので、データフレームを用いてさっそくレッスンを進めていきたいと思います。
データフレームの作成については次回レッスンで説明しますので、ここではcsvファイルを読み込む方法でデータフレームを作成します。
それではPandasをインポートするところから始めていきましょう。
import pandas as pd
まず、Pandasをインポートする記述を書きます。
「import pandas as pd」を書きます。
「as」は、ライブラリ名(pandas)を好きな名前で使うことができます。
したがって、この記述により「pandas」を「pd」という名前で使うことができます。
エラーにならず、インポートが完了しました。
df_population_data = pd.read_csv('data.csv',encoding='shift-jis')
次に、pandasの関数を使ってcsvファイルを読み取ってみましょう。
このコースでは、政府が発表している「1920年から2015年までの全国の人口推移のデータ」を使います。
csvファイルは、このデータが記述されています。
csvファイルの中身をみてみましょう。
一番左の列は都道府県ごとのコードになっています。
北海道なら1という番号、東京なら13という番号がふられています。
次の列は、番号に対応した都道府県が入っています。
次に、元号と和暦です。
その次は、西暦となっていて、その次が人口の総数になっています。
その隣が男女別の人口が記載されています。
このファイルを使って、このレッスンを進めていきます。
Pandasでは、このようなcsvファイルを読み込むことができます。
read_csv関数を使います。
read_csv関数を使うと、csvをデータフレームとして読み込むことができます。
変数名は、データフレームを省略した「df」と人口のデータという意味で、「df_population_data」としましょう。
次に、イコールを書いて、「pd」を書きます。
次に、ドットを書いて、「read_csv」を書きます。
次に、丸括弧を書いて、シングルクォーテーションを書きます。
シングルクォーテーション中に、csvファイルのパスとファイル名を(data.csv)を書きます。
encodingの引数で、文字コードを指定できます。今回は、shift-jisを指定します。他にもutf-8なども指定できます。
実行すると、変数(df_population_data)に、データフレームを代入します。
変数にデータが代入されたはずです。
df_population_data
表示させてみましょう。
CSVファイルが読み込まれていることがわかります。
※続きは文字書き起こしブログで
▼文字書き起こしブログ
https://kino-code.com/pandas_course_pandas/
▼使用データについて
出典:政府統計の総合窓口(e-Stat)
https://www.e-stat.go.jp/
#Pandasの使い方 #PythonとPandas #PandasでCSV操作
▼お仕事のお問い合わせ
キノコードでは、仕事の自動化の開発業務&コンサルティング業務のみを現在受け付けております。
お問い合わせ先かTwitterのDMか、「キノコードトップページ→概要」にあるメールアドレスまでお問い合わせください。