\キノコードが作ったプログラミング学習 サービス登場/
学んだ知識をその場でアウトプットできるからスキルの定着が実感できる
Python学習といえば、キノクエスト!
・問題数は充実の350問以上
・環境構築は不要!
・カリキュラムがあるので学習方法に迷わない
▼登録はこちら▼
https://kino-code.com/kq_service_a/?utm_source=youtube.com&utm_medium=referral&utm_campaign=tSdQeNOWUl4_gaiyou
ーーー
この動画では、データフレームの使い方について説明します。初心者の方でもわかりやすいように丁寧な解説を心がけました。目次は下記になります。
▼目次
00:00 はじめに
01:26 データフレームとは
03:33 データフレーム作成方法
03:38 Pandasインストール
04:18 2次元リストを使った作成方法
05:28 NumPyインストール
05:55 NumPy配列を使った作成方法
06:21 インデックス、カラム参照
06:59 辞書型を使った作成方法
08:34 カラム、インデックスの操作
09:41 renameメソッドでカラム名変更
10:44 renameメソッドでインデックス名変更
11:06 列を取得
12:21 locプロパティで行を取得
13:06 locプロパティで行と列を指定して取得
13:29 locプロパティで列を取得
14:05 ilocプロパティで列を取得
14:32 locプロパティでデータ操作
14:53 locプロパティでデータ変更
15:06 複数のデータ変更
15:41 スライスを使ってデータ取得
16:49 get_locメソッドで行番号取得
17:11 get_locメソッドで列番号取得
18:15 データ型を調べる
18:43 行数・列数取得
19:00 行と列を入れ替え
19:16 確認問題
21:01 まとめ
▼自己紹介
現在:フリーランス(マーケティング関連の人工知能開発、データ分析や業務自動化など)
前職:リクルート
▼SNS
Twitter : https://twitter.com/kino_code/likes
Facebook :https://www.facebook.com/%E3%82%AD%E3%83%8E%E3%82%B3%E3%83%BC%E3%83%89-105693727500005/
▼文字書き起こし
データフレームは、Pandasのスタート地点であり、ベースになる部分です。
というのも、例えば、Pandasの得意なデータ解析は、データを取得して、取得したデータをグループごとに集めたり、並び替えたり、グラフにするというプロセスを経ます。
データフレームは、その最初のデータを取得し、データを作るパートです。
そのため、データ分析のスタートでありベースとなる部分です。
また、データフレームは、エクセルの表形式のように、行と列で成り立っています。
他にも、データベースも表形式です。エクセルやデータベースを読み込むPandasのデータフレームは非常によく使われます。
したがって、データフレームは、重要な部分です。
初心者の方が理解できるように丁寧な説明を心がけました。
最後に確認問題もあるのでぜひトライしてみてください。
キノコードでは、pythonの入門コース、Pandas超入門コースの他に、データ可視化のmatplotlibや人工知能のレッスンもアップしていく予定です。
新しい動画が更新されたときに通知がいくように、また、復習をする時に動画がどこにいったかわからなくならないようにチャンネル登録をお願いします。
それではパソコン画面に切り替えてレッスンを進めていきます。
データフレームについて、動画の最初の方でふれましたが、もう少し詳しく説明していきます。
データフレームとは、ラベル付きニ次元配列のことです。
配列とは、データの集まりのことです。
配列が1つなら、1次元配列です。
1行にたくさん数字があるだけです。つまり、横に広がるだけです。
一方、二次元になるとと、縦に広がっていきます。
つまり、二次元配列とは、横と縦にデータが集まっていることになります。
Pythonでは、配列のことをリストといいます。
リストが1つある状態は1次元配列です。
2つある状態が2次元配列です。
では、3つできた場合は3次元でしょうか?
この場合も2次元です。
なぜなら、角括弧が2つです。
行と列で表すなら、このような感じです。
3次元の場合は、奥行きです。
さて話を戻して、データフレームは、2次元の配列です。
横のことを列、縦のことを行といいます。
つまり、データフレームは、エクセルの表のように、行と列で成り立っているイメージです。
行には行名であるインデックス、列名であるカラムがあります。2次元の配列だけではなく行名や列名を付けられることが、ラベル付き配列の「ラベル」である理由です。
そして、インデックスとカラムの他に、データ部分があります。
つまり、データフレームはインデックスとカラムとデータ部分の3つから成り立っています。
なお、データフレームから列を取り出すとシリーズというものになります。
逆の言い方をすると、データフレームはシリーズの集まりとも言えます。
シリーズとは、ラベル付き一次元配列のことです。
シリーズについては、次回のレッスンで詳しく説明します。
それでは、実際に作成してどのようなものか見てみましょう。
データフレームの作成方法はいくつかあります。
このレッスンでは、3つの作成方法を紹介します。
1つ目は、リスト型の値を持った配列を使う方法です。
まず、Pandasをインポートしてから始めます。
import pandas as pd
「as」は、ライブラリ名を好きな名前で使うことができます。
したがって、この記述により「pandas」を「pd」という名前で使うことができます。
それでは実行します。インポートされました。
df = pd.DataFrame([[1, 2, 3], [4, 5, 6], [7, 8, 9]],
columns=['col01', 'col02', 'col03'],
index=['idx01', 'idx02', 'idx03'])
df
それでは、データフレームを作っていきましょう。
データフレームの完成イメージは、このようになります。
インデックス名を「idx01~03」、カラム名を「col01~03」にします。
データの部分を、1行目は「1~3」、2行目は「4~6」、3行目は「7~9」にします。
それでは、コードをみていきましょう。
「df」という変数を書きます。
次に、イコール、pd、ドット、DataFrameを書きます。
そして、引数に2次元のリストを書いて、カラム名、インデックス名を書いていきます。
2次元のリスト部分は、リストの中にリストを作るイメージです。
外側のリストを書いて、内側のリストに「1~3」、「4~6」、「7~9」のようなリストを3つ書きます。
リストの作り方については、「Python超入門コース リスト」をご覧ください。右上にカードがでているはずです。
次に、カンマを書いて、カラム名を指定していきます。
まず、「columns」を書いて、イコール、カラム名のリストを書きます。
カラム名は、「col01~03」とします。
最後に、カンマを書いて、インデックス名を指定していきます。
イコール、インデックス名のリストを書きます。
インデックス名は、「idx01~03」とします。
これで、データフレームができました。
それでは、中身をみてみましょう。
スライドと同じデータフレームができました。
※続きは文字書き起こしブログで
▼文字書き起こしブログ
https://kino-code.com/pandas_course_dataframe/
#データフレーム(DataFrame) #PythonとPandas #Pandasの使い方
▼お仕事のお問い合わせ
キノコードでは、仕事の自動化の開発業務&コンサルティング業務のみを現在受け付けております。
お問い合わせ先かTwitterのDMか、「キノコードトップページ→概要」にあるメールアドレスまでお問い合わせください。