pandas info()
index:
.info()
dataFrame についての、情報が表示できます。
importしておきます
# import numpy as np import numpy.random as random import scipy as sp import pandas as pd from pandas import Series, DataFrame
データの定義
# # a1 = { 'ID':['11','12','13', '14' ] ,'num1':[ 101 ,102,103 , 101] ,'num2':[ 201 ,202,203 ,204 ] ,'num3':[ 301 ,302,303 ,304 ] } frame1 = DataFrame(a1 ) print(frame1 )
結果:
ID num1 num2 num3 0 11 101 201 301 1 12 102 202 302 2 13 103 203 303 3 14 101 204 304
info() 実行
frame1.info()
結果:
null 判定, 型の表示ができます。
# <class 'pandas.core.frame.DataFrame'> RangeIndex: 4 entries, 0 to 3 Data columns (total 4 columns): ID 4 non-null object num1 4 non-null int64 num2 4 non-null int64 num3 4 non-null int64 dtypes: int64(3), object(1) memory usage: 148.0+ bytes
mean
平均値、 num1 の平均を出力します。
# # 平均値 print( frame1.num1.mean())
結果:
# 101.75
median()
中央値
# 中央値 print( frame1.num1.median())
結果:
101.5
mode()
最頻値:出現する頻度が多い値
print(frame1.num1.mode())
結果:
0 101 dtype: int64
describe()
要約統計量 の表示
# a1 =frame1.describe() print(a1 )
結果:
num1 num2 num3 count 4.000000 4.000000 4.000000 mean 101.750000 202.500000 302.500000 std 0.957427 1.290994 1.290994 min 101.000000 201.000000 301.000000 25% 101.000000 201.750000 301.750000 50% 101.500000 202.500000 302.500000 75% 102.250000 203.250000 303.250000 max 103.000000 204.000000 304.000000
出力内容:
データ数
平均値
標準偏差
最小値
第一四分位数
第二四分位数
第三四分位数
最大値