python pandas की समीक्षा · python pandas (एक नज़र) •data क...
TRANSCRIPT
Python Pandas की समीकषा सीबीएसई पाठयकरम पर आधाररत
इनफामटिकस परटकिसज ककषा -12
दवारा सजीव भदौररया सनातकोततर टिकषक (सगणक टवजञान ) क० टव० बाराबकी (लखनऊ सभाग)
अधयाय -1
Python Pandas ( एक नज़र) bull Data को analysis करन का एक ऄतयत महतवपरण हहससा होता
ह- Data Processing कयो कक data हमशा आहछित format म
नही होता ह |
bull Data को analysis करन स पहल बहत सारी processing की
ज़ररत होती ह जस - Cleaning Restructuring या merging
आतयाकद |
bull Data को fast process करन क हलए python म बहत सार
tools ईपलबध ह ndash जस - Numpy Scipy Cython और
Pandas
bull Pandas को Numpy क उपर रखा गया ह |
bull आस धयाय म हम Python Pandas Data Series और
DataFrames क basic concepts सीखग हजनह हमन ककषा -
11 म भी सीखा था | सॊजीव भदौररया क० वव० बाराबॊकी
Python Pandas bull Pandas एक open-source python की library ह जो ऄपन powerful data-structure
का परयोग करक data manipulation और ईसको analysis करन की सहवधा परदान करती ह |
bull आनकी performance बहत ऄछिी होती ह |
bull Pandas हवहभनन परकार क data को process करन क हलए कइ functions परदान करता ह |
bull Data analysis करत समय यह बहत धयान रखना होता ह की अप सही data type को परयोग
कर रह ह ऄनयथा अपको कइ errors का सामना करना पड सकता ह | pandas क दवारा हनमन
data type पर असानी स काम ककया जा सकता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas Series bull Pandas की primary building block Series ही होती ह |
bull Series एक labeled One-Dimensional Array होती ह जो ककसी भी data type को
hold कर सकती ह |
bull Series का data हमशा mutable होता ह ऄथाणत आनको बदला जा सकता ह |
bull लककन Series क data का size immutable होता ह |
bull यह एक परकार स 2 arrays का structure परतीत होता ह हजसम एक index होता ह और दसर
म actual values
bull Series म row labels को index कहा जाता ह |
bull हनमन ईदहारर data types ह हजनस series बनाइ जा सकती ह और ऐसा करन क हलए
series() का परयोग ककया जाता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Series Objects को बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ndash एक series type object को कइ तरीको स बनाया जा सकता ह |
1 Series ( ) फकशन का परयोग करक -
ltSeries Objectgt = pandasSeries( ) यह empty series बनाएगा |
2 Non-empty series बनाना ndash
Import pandas as pd
ltSeries Objectgt = pdSeries(data index=idx) जहाा data कोइ भी
python sequence ndarray python dictionary या scaler value हो सकता ह |
Index Index
Series Objects को बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
1 Dictionary क साथ series बनाना
2 Scalar value क साथ series बनाना -
Index of Keys
Series Object Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
3 कि common attributes हनमन ह-
ltseries objectgtltAttributeNamegt
Attribute Description Seriesindex Returns index of the series
Seriesvalues Returns ndarray
Seriesdtype Returns dtype object of the underlying data
Seriesshape Returns tuple of the shape of underlying data
Seriesnbytes Return number of bytes of underlying data
Seriesndim Returns the number of dimention
Seriessize Returns number of elements
Seriesintemsize Returns the size of the dtype
Serieshasnans Returns true if there are any NaN
Seriesempty Returns true if series object is empty
Series Object Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
Series Object को access करना
सॊजीव भदौररया क० वव० बाराबॊकी
Individual value को print करना
ऑबजकट की values को print करना
Objects की slicing
Objects की slicing करना बहत आसान ह बस ननमन syntax का अनसरण कररए ltobjectNamegt[ltstartgtltstopgtltstep gt]
head() और tail () Function
सॊजीव भदौररया क० वव० बाराबॊकी
1 head(ltngt ) function शर स n elements return करता ह यकद n न द
तो ऄपन अप शर क 5 record कदखायगा |
2 tail(ltngt ) function अहखरी स n elements return करता ह यकद n न द
तो ऄपन अप अहखरी क 5 record कदखायगा |
NumPy array और Series objects म ऄतर
सॊजीव भदौररया क० वव० बाराबॊकी
1 ndarray क case म अप तभी vector operation कर सकत ह
जब दोनो ndarray क shape सामान हो | जबकक series
ऑबजकट क कस म ऄगर मचिग index क साथ ही align होगा
ऄनयथा NaN return होता ह |
2 ndarray म index हमशा 0 स शर होता ह और सदव numeric
ही होगा |लककन series म numbers क अलावा ककसी भी type
का index हो सकता ह और ज़ररी नही की index 0 स शर हो |
DataFrame bull Pandas का मखय object DataFrame होता ह | और यह pandas का सबस ऄहधक परयोग
ककया जान वाला Data Structure ह |
bull DataFrame एक Two -Dimensional Array होता ह जो ककसी भी data type को hold
कर सकती ह | और यह tabular format म data को store करता ह |
bull Finance Statistics Social Science और कइ engineering branch म आसका परयोग
ऄहधकता म ककया जाता ह |
bull DataFrame म data और आसका size दोनो ही mutable होत ह ऄथाणत आनह बदला जा
सकता ह |
bull DataFrame म दो हवहभनन indexes होत ह - row index और column index |
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame को बनाना और परदरशशत करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull 2 D फॉमट म डाटा को pass करक एक DataFrame object बनाया जा
सकता ह |
import pandas as pd ltdataFrameObjectgt = pdDataFrame(lta 2D Data Structuregt [columns=ltcolumn
sequencegt][index=ltindex sequencegt])
bull अप DataFrame को कइ तरीक स data values pass करक बना सकत ह
जस ndash
bull 2D dictionaries
bull 2D ndarrays
bull Series type object
bull Another DataFrame object
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदाहरर म index सवतः 0 स
5 तक अगय तथा column क name
सवतः वाही अय जो dictionary म
keys थी |
2D Dictionary क keys column क
नाम हो गए
nprange(n) का
परयोग करक indexes
सवतः हनरशमत हो गयी |
A List या ndarrays की dictionary स DataFrame बनाना |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा indexes अपन
specify ककय ह |
ऄथाणत यकद अप index का sequence दत ह तो index अपक दवारा
कदया गया ही set होगा ऄनयथा वह सवतः 0 स n-1 तक का index
ललगा |
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की
dictionaries स हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
B Dictionaries की dictionary स DataFrame बनाना |
यहाा अप index और column
name दख कर समझ सकत ह
की कस assign हए
यकद यहाा yr2015 yr2016 और yr2017 क keys
ऄलग होत तो dataframe क rows और column
जयादा बढ़ जात और हबना match वाल row और
column म NaN store हो जाता |
2D ndarray स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
आसम column name और index सवतः ऄगय|
आसम column name user न कदए ह |
आसम column name तथा index दोनो
user न कदए ह |
Series Object की 2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की Series स
हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
DataFrame ऑबजकट को आस परकार भी
बनाया जा सकता ह |
दसर DataFrame ऑबजकट स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame ऑबजकट को दसर
DataFrame ऑबजकट स बनाया गया ह|
DataFrame ऑबजकट को display करना| DataFrame ऑबजकट
को display करन का
syntax य ह |
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
bull जब अप एक DataFrame ऑबजकट बनात ह तो आसस समबहधत समसत सिना जस
- size आसका datatype आतयाकद attributes क दवारा परापत ककय जा सकत ह |
ltDataFrame Objectgtltattribute namegt
bull कि attributes हनमन ह -
Attribute Description
index यह dataframe क index मतऱब (row lebels) को ददखता ह | columns यह dataframe क column lebels को ददखता ह | axes यह दोनो axes अथाात index और column को return करता ह | dtypes यह dataframe क अनदर रख डाटा का datatype return करता ह| size ऑबजकट म उपसथथत elements की सॊखया return करता ह | shape यह dataframe की dimention की tuple return करता ह | values यह dataframe का numpy रप return करता ह | empty यह एक सचक ह की dataframe empty ह या नह ॊ| ndim यह axesarray की dimention को return करता ह | T यह index और column को transpose कर दता ह|
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame स Selecting और Accessing
सॊजीव भदौररया क० वव० बाराबॊकी
bull Column को select करना
ltDataFrame Objectgt[ltcolumn namegt]
या ltDataFrame Objectgtltcolumn namegt
ltDataFrame Objectgt[column name की list ]
एक column को select करन क लऱए
कई column को select करन क लऱए
कई column म हम करम बदऱ सकत ह|
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgtloc [ltStartRowgt ltEndRowgt ltStartColgt ltEndColgt]
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgt iloc [ltRow Indexgt ltRowIndexgt ltColIndexgt ltColIndexgt]
DataFrame स Individual Value को select करना ltDFObjectgt ltcol name[row name or row index]
या
ltDFObjectgt at [ltrow namegtltcol namegt]
या
ltDFObjectgt iat[ltrow indexgt ltcol indexgt]
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
a) नए column को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltCol Namegt[ltrow labelgt]=ltnew valuegt
चॉकक इसम lsquoFourrsquo नाम स कोई column नह ॊ ह तो नया column add हो गया |
चॉकक इसम lsquoFourrsquo नाम स column ह तो column क मानो म बदऱाव हो गया |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
b) नए row को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgt at[ltRowNamegt ] =ltnew valuegt
या
ltDFObjectgt loc[ltRowNamegt ] =ltnew valuegt
चॉकक इसम lsquoDrsquo नाम स कोई row नह ॊ थी तो नयी row add हो गयी |
चॉकक इसम lsquoDrsquo नाम स row नह ॊ तो row की values change हो गयी |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
c) Single value को change करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltColNamegt[ltRowNameLebelgt]
इसम D वाऱ row म lsquoThreersquo वाऱ column म value बदऱ गयी |
Values को ऐस भी change ककया जा सकता ह | सजसम row या column क अऱग अऱग values भी ददए जा सकत ह |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
Column को delete करन क हलए हनमन syntax का परयोग कर |
del ltDFObjectgt[ltColNamegt] या
dfdrop([ltCol1NamegtltCol2Namegt ] axis=1)
axis =1 यह बताता ह की column को delete करना ह
del कमाॊड delete करन क बाद value return नह ॊ करता ह जबकक drop method delete करन क बाद तरॊत बची हई dataframe को return करता ह|
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Python Pandas ( एक नज़र) bull Data को analysis करन का एक ऄतयत महतवपरण हहससा होता
ह- Data Processing कयो कक data हमशा आहछित format म
नही होता ह |
bull Data को analysis करन स पहल बहत सारी processing की
ज़ररत होती ह जस - Cleaning Restructuring या merging
आतयाकद |
bull Data को fast process करन क हलए python म बहत सार
tools ईपलबध ह ndash जस - Numpy Scipy Cython और
Pandas
bull Pandas को Numpy क उपर रखा गया ह |
bull आस धयाय म हम Python Pandas Data Series और
DataFrames क basic concepts सीखग हजनह हमन ककषा -
11 म भी सीखा था | सॊजीव भदौररया क० वव० बाराबॊकी
Python Pandas bull Pandas एक open-source python की library ह जो ऄपन powerful data-structure
का परयोग करक data manipulation और ईसको analysis करन की सहवधा परदान करती ह |
bull आनकी performance बहत ऄछिी होती ह |
bull Pandas हवहभनन परकार क data को process करन क हलए कइ functions परदान करता ह |
bull Data analysis करत समय यह बहत धयान रखना होता ह की अप सही data type को परयोग
कर रह ह ऄनयथा अपको कइ errors का सामना करना पड सकता ह | pandas क दवारा हनमन
data type पर असानी स काम ककया जा सकता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas Series bull Pandas की primary building block Series ही होती ह |
bull Series एक labeled One-Dimensional Array होती ह जो ककसी भी data type को
hold कर सकती ह |
bull Series का data हमशा mutable होता ह ऄथाणत आनको बदला जा सकता ह |
bull लककन Series क data का size immutable होता ह |
bull यह एक परकार स 2 arrays का structure परतीत होता ह हजसम एक index होता ह और दसर
म actual values
bull Series म row labels को index कहा जाता ह |
bull हनमन ईदहारर data types ह हजनस series बनाइ जा सकती ह और ऐसा करन क हलए
series() का परयोग ककया जाता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Series Objects को बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ndash एक series type object को कइ तरीको स बनाया जा सकता ह |
1 Series ( ) फकशन का परयोग करक -
ltSeries Objectgt = pandasSeries( ) यह empty series बनाएगा |
2 Non-empty series बनाना ndash
Import pandas as pd
ltSeries Objectgt = pdSeries(data index=idx) जहाा data कोइ भी
python sequence ndarray python dictionary या scaler value हो सकता ह |
Index Index
Series Objects को बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
1 Dictionary क साथ series बनाना
2 Scalar value क साथ series बनाना -
Index of Keys
Series Object Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
3 कि common attributes हनमन ह-
ltseries objectgtltAttributeNamegt
Attribute Description Seriesindex Returns index of the series
Seriesvalues Returns ndarray
Seriesdtype Returns dtype object of the underlying data
Seriesshape Returns tuple of the shape of underlying data
Seriesnbytes Return number of bytes of underlying data
Seriesndim Returns the number of dimention
Seriessize Returns number of elements
Seriesintemsize Returns the size of the dtype
Serieshasnans Returns true if there are any NaN
Seriesempty Returns true if series object is empty
Series Object Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
Series Object को access करना
सॊजीव भदौररया क० वव० बाराबॊकी
Individual value को print करना
ऑबजकट की values को print करना
Objects की slicing
Objects की slicing करना बहत आसान ह बस ननमन syntax का अनसरण कररए ltobjectNamegt[ltstartgtltstopgtltstep gt]
head() और tail () Function
सॊजीव भदौररया क० वव० बाराबॊकी
1 head(ltngt ) function शर स n elements return करता ह यकद n न द
तो ऄपन अप शर क 5 record कदखायगा |
2 tail(ltngt ) function अहखरी स n elements return करता ह यकद n न द
तो ऄपन अप अहखरी क 5 record कदखायगा |
NumPy array और Series objects म ऄतर
सॊजीव भदौररया क० वव० बाराबॊकी
1 ndarray क case म अप तभी vector operation कर सकत ह
जब दोनो ndarray क shape सामान हो | जबकक series
ऑबजकट क कस म ऄगर मचिग index क साथ ही align होगा
ऄनयथा NaN return होता ह |
2 ndarray म index हमशा 0 स शर होता ह और सदव numeric
ही होगा |लककन series म numbers क अलावा ककसी भी type
का index हो सकता ह और ज़ररी नही की index 0 स शर हो |
DataFrame bull Pandas का मखय object DataFrame होता ह | और यह pandas का सबस ऄहधक परयोग
ककया जान वाला Data Structure ह |
bull DataFrame एक Two -Dimensional Array होता ह जो ककसी भी data type को hold
कर सकती ह | और यह tabular format म data को store करता ह |
bull Finance Statistics Social Science और कइ engineering branch म आसका परयोग
ऄहधकता म ककया जाता ह |
bull DataFrame म data और आसका size दोनो ही mutable होत ह ऄथाणत आनह बदला जा
सकता ह |
bull DataFrame म दो हवहभनन indexes होत ह - row index और column index |
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame को बनाना और परदरशशत करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull 2 D फॉमट म डाटा को pass करक एक DataFrame object बनाया जा
सकता ह |
import pandas as pd ltdataFrameObjectgt = pdDataFrame(lta 2D Data Structuregt [columns=ltcolumn
sequencegt][index=ltindex sequencegt])
bull अप DataFrame को कइ तरीक स data values pass करक बना सकत ह
जस ndash
bull 2D dictionaries
bull 2D ndarrays
bull Series type object
bull Another DataFrame object
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदाहरर म index सवतः 0 स
5 तक अगय तथा column क name
सवतः वाही अय जो dictionary म
keys थी |
2D Dictionary क keys column क
नाम हो गए
nprange(n) का
परयोग करक indexes
सवतः हनरशमत हो गयी |
A List या ndarrays की dictionary स DataFrame बनाना |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा indexes अपन
specify ककय ह |
ऄथाणत यकद अप index का sequence दत ह तो index अपक दवारा
कदया गया ही set होगा ऄनयथा वह सवतः 0 स n-1 तक का index
ललगा |
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की
dictionaries स हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
B Dictionaries की dictionary स DataFrame बनाना |
यहाा अप index और column
name दख कर समझ सकत ह
की कस assign हए
यकद यहाा yr2015 yr2016 और yr2017 क keys
ऄलग होत तो dataframe क rows और column
जयादा बढ़ जात और हबना match वाल row और
column म NaN store हो जाता |
2D ndarray स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
आसम column name और index सवतः ऄगय|
आसम column name user न कदए ह |
आसम column name तथा index दोनो
user न कदए ह |
Series Object की 2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की Series स
हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
DataFrame ऑबजकट को आस परकार भी
बनाया जा सकता ह |
दसर DataFrame ऑबजकट स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame ऑबजकट को दसर
DataFrame ऑबजकट स बनाया गया ह|
DataFrame ऑबजकट को display करना| DataFrame ऑबजकट
को display करन का
syntax य ह |
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
bull जब अप एक DataFrame ऑबजकट बनात ह तो आसस समबहधत समसत सिना जस
- size आसका datatype आतयाकद attributes क दवारा परापत ककय जा सकत ह |
ltDataFrame Objectgtltattribute namegt
bull कि attributes हनमन ह -
Attribute Description
index यह dataframe क index मतऱब (row lebels) को ददखता ह | columns यह dataframe क column lebels को ददखता ह | axes यह दोनो axes अथाात index और column को return करता ह | dtypes यह dataframe क अनदर रख डाटा का datatype return करता ह| size ऑबजकट म उपसथथत elements की सॊखया return करता ह | shape यह dataframe की dimention की tuple return करता ह | values यह dataframe का numpy रप return करता ह | empty यह एक सचक ह की dataframe empty ह या नह ॊ| ndim यह axesarray की dimention को return करता ह | T यह index और column को transpose कर दता ह|
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame स Selecting और Accessing
सॊजीव भदौररया क० वव० बाराबॊकी
bull Column को select करना
ltDataFrame Objectgt[ltcolumn namegt]
या ltDataFrame Objectgtltcolumn namegt
ltDataFrame Objectgt[column name की list ]
एक column को select करन क लऱए
कई column को select करन क लऱए
कई column म हम करम बदऱ सकत ह|
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgtloc [ltStartRowgt ltEndRowgt ltStartColgt ltEndColgt]
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgt iloc [ltRow Indexgt ltRowIndexgt ltColIndexgt ltColIndexgt]
DataFrame स Individual Value को select करना ltDFObjectgt ltcol name[row name or row index]
या
ltDFObjectgt at [ltrow namegtltcol namegt]
या
ltDFObjectgt iat[ltrow indexgt ltcol indexgt]
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
a) नए column को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltCol Namegt[ltrow labelgt]=ltnew valuegt
चॉकक इसम lsquoFourrsquo नाम स कोई column नह ॊ ह तो नया column add हो गया |
चॉकक इसम lsquoFourrsquo नाम स column ह तो column क मानो म बदऱाव हो गया |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
b) नए row को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgt at[ltRowNamegt ] =ltnew valuegt
या
ltDFObjectgt loc[ltRowNamegt ] =ltnew valuegt
चॉकक इसम lsquoDrsquo नाम स कोई row नह ॊ थी तो नयी row add हो गयी |
चॉकक इसम lsquoDrsquo नाम स row नह ॊ तो row की values change हो गयी |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
c) Single value को change करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltColNamegt[ltRowNameLebelgt]
इसम D वाऱ row म lsquoThreersquo वाऱ column म value बदऱ गयी |
Values को ऐस भी change ककया जा सकता ह | सजसम row या column क अऱग अऱग values भी ददए जा सकत ह |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
Column को delete करन क हलए हनमन syntax का परयोग कर |
del ltDFObjectgt[ltColNamegt] या
dfdrop([ltCol1NamegtltCol2Namegt ] axis=1)
axis =1 यह बताता ह की column को delete करना ह
del कमाॊड delete करन क बाद value return नह ॊ करता ह जबकक drop method delete करन क बाद तरॊत बची हई dataframe को return करता ह|
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Python Pandas bull Pandas एक open-source python की library ह जो ऄपन powerful data-structure
का परयोग करक data manipulation और ईसको analysis करन की सहवधा परदान करती ह |
bull आनकी performance बहत ऄछिी होती ह |
bull Pandas हवहभनन परकार क data को process करन क हलए कइ functions परदान करता ह |
bull Data analysis करत समय यह बहत धयान रखना होता ह की अप सही data type को परयोग
कर रह ह ऄनयथा अपको कइ errors का सामना करना पड सकता ह | pandas क दवारा हनमन
data type पर असानी स काम ककया जा सकता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas Series bull Pandas की primary building block Series ही होती ह |
bull Series एक labeled One-Dimensional Array होती ह जो ककसी भी data type को
hold कर सकती ह |
bull Series का data हमशा mutable होता ह ऄथाणत आनको बदला जा सकता ह |
bull लककन Series क data का size immutable होता ह |
bull यह एक परकार स 2 arrays का structure परतीत होता ह हजसम एक index होता ह और दसर
म actual values
bull Series म row labels को index कहा जाता ह |
bull हनमन ईदहारर data types ह हजनस series बनाइ जा सकती ह और ऐसा करन क हलए
series() का परयोग ककया जाता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Series Objects को बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ndash एक series type object को कइ तरीको स बनाया जा सकता ह |
1 Series ( ) फकशन का परयोग करक -
ltSeries Objectgt = pandasSeries( ) यह empty series बनाएगा |
2 Non-empty series बनाना ndash
Import pandas as pd
ltSeries Objectgt = pdSeries(data index=idx) जहाा data कोइ भी
python sequence ndarray python dictionary या scaler value हो सकता ह |
Index Index
Series Objects को बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
1 Dictionary क साथ series बनाना
2 Scalar value क साथ series बनाना -
Index of Keys
Series Object Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
3 कि common attributes हनमन ह-
ltseries objectgtltAttributeNamegt
Attribute Description Seriesindex Returns index of the series
Seriesvalues Returns ndarray
Seriesdtype Returns dtype object of the underlying data
Seriesshape Returns tuple of the shape of underlying data
Seriesnbytes Return number of bytes of underlying data
Seriesndim Returns the number of dimention
Seriessize Returns number of elements
Seriesintemsize Returns the size of the dtype
Serieshasnans Returns true if there are any NaN
Seriesempty Returns true if series object is empty
Series Object Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
Series Object को access करना
सॊजीव भदौररया क० वव० बाराबॊकी
Individual value को print करना
ऑबजकट की values को print करना
Objects की slicing
Objects की slicing करना बहत आसान ह बस ननमन syntax का अनसरण कररए ltobjectNamegt[ltstartgtltstopgtltstep gt]
head() और tail () Function
सॊजीव भदौररया क० वव० बाराबॊकी
1 head(ltngt ) function शर स n elements return करता ह यकद n न द
तो ऄपन अप शर क 5 record कदखायगा |
2 tail(ltngt ) function अहखरी स n elements return करता ह यकद n न द
तो ऄपन अप अहखरी क 5 record कदखायगा |
NumPy array और Series objects म ऄतर
सॊजीव भदौररया क० वव० बाराबॊकी
1 ndarray क case म अप तभी vector operation कर सकत ह
जब दोनो ndarray क shape सामान हो | जबकक series
ऑबजकट क कस म ऄगर मचिग index क साथ ही align होगा
ऄनयथा NaN return होता ह |
2 ndarray म index हमशा 0 स शर होता ह और सदव numeric
ही होगा |लककन series म numbers क अलावा ककसी भी type
का index हो सकता ह और ज़ररी नही की index 0 स शर हो |
DataFrame bull Pandas का मखय object DataFrame होता ह | और यह pandas का सबस ऄहधक परयोग
ककया जान वाला Data Structure ह |
bull DataFrame एक Two -Dimensional Array होता ह जो ककसी भी data type को hold
कर सकती ह | और यह tabular format म data को store करता ह |
bull Finance Statistics Social Science और कइ engineering branch म आसका परयोग
ऄहधकता म ककया जाता ह |
bull DataFrame म data और आसका size दोनो ही mutable होत ह ऄथाणत आनह बदला जा
सकता ह |
bull DataFrame म दो हवहभनन indexes होत ह - row index और column index |
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame को बनाना और परदरशशत करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull 2 D फॉमट म डाटा को pass करक एक DataFrame object बनाया जा
सकता ह |
import pandas as pd ltdataFrameObjectgt = pdDataFrame(lta 2D Data Structuregt [columns=ltcolumn
sequencegt][index=ltindex sequencegt])
bull अप DataFrame को कइ तरीक स data values pass करक बना सकत ह
जस ndash
bull 2D dictionaries
bull 2D ndarrays
bull Series type object
bull Another DataFrame object
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदाहरर म index सवतः 0 स
5 तक अगय तथा column क name
सवतः वाही अय जो dictionary म
keys थी |
2D Dictionary क keys column क
नाम हो गए
nprange(n) का
परयोग करक indexes
सवतः हनरशमत हो गयी |
A List या ndarrays की dictionary स DataFrame बनाना |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा indexes अपन
specify ककय ह |
ऄथाणत यकद अप index का sequence दत ह तो index अपक दवारा
कदया गया ही set होगा ऄनयथा वह सवतः 0 स n-1 तक का index
ललगा |
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की
dictionaries स हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
B Dictionaries की dictionary स DataFrame बनाना |
यहाा अप index और column
name दख कर समझ सकत ह
की कस assign हए
यकद यहाा yr2015 yr2016 और yr2017 क keys
ऄलग होत तो dataframe क rows और column
जयादा बढ़ जात और हबना match वाल row और
column म NaN store हो जाता |
2D ndarray स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
आसम column name और index सवतः ऄगय|
आसम column name user न कदए ह |
आसम column name तथा index दोनो
user न कदए ह |
Series Object की 2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की Series स
हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
DataFrame ऑबजकट को आस परकार भी
बनाया जा सकता ह |
दसर DataFrame ऑबजकट स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame ऑबजकट को दसर
DataFrame ऑबजकट स बनाया गया ह|
DataFrame ऑबजकट को display करना| DataFrame ऑबजकट
को display करन का
syntax य ह |
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
bull जब अप एक DataFrame ऑबजकट बनात ह तो आसस समबहधत समसत सिना जस
- size आसका datatype आतयाकद attributes क दवारा परापत ककय जा सकत ह |
ltDataFrame Objectgtltattribute namegt
bull कि attributes हनमन ह -
Attribute Description
index यह dataframe क index मतऱब (row lebels) को ददखता ह | columns यह dataframe क column lebels को ददखता ह | axes यह दोनो axes अथाात index और column को return करता ह | dtypes यह dataframe क अनदर रख डाटा का datatype return करता ह| size ऑबजकट म उपसथथत elements की सॊखया return करता ह | shape यह dataframe की dimention की tuple return करता ह | values यह dataframe का numpy रप return करता ह | empty यह एक सचक ह की dataframe empty ह या नह ॊ| ndim यह axesarray की dimention को return करता ह | T यह index और column को transpose कर दता ह|
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame स Selecting और Accessing
सॊजीव भदौररया क० वव० बाराबॊकी
bull Column को select करना
ltDataFrame Objectgt[ltcolumn namegt]
या ltDataFrame Objectgtltcolumn namegt
ltDataFrame Objectgt[column name की list ]
एक column को select करन क लऱए
कई column को select करन क लऱए
कई column म हम करम बदऱ सकत ह|
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgtloc [ltStartRowgt ltEndRowgt ltStartColgt ltEndColgt]
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgt iloc [ltRow Indexgt ltRowIndexgt ltColIndexgt ltColIndexgt]
DataFrame स Individual Value को select करना ltDFObjectgt ltcol name[row name or row index]
या
ltDFObjectgt at [ltrow namegtltcol namegt]
या
ltDFObjectgt iat[ltrow indexgt ltcol indexgt]
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
a) नए column को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltCol Namegt[ltrow labelgt]=ltnew valuegt
चॉकक इसम lsquoFourrsquo नाम स कोई column नह ॊ ह तो नया column add हो गया |
चॉकक इसम lsquoFourrsquo नाम स column ह तो column क मानो म बदऱाव हो गया |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
b) नए row को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgt at[ltRowNamegt ] =ltnew valuegt
या
ltDFObjectgt loc[ltRowNamegt ] =ltnew valuegt
चॉकक इसम lsquoDrsquo नाम स कोई row नह ॊ थी तो नयी row add हो गयी |
चॉकक इसम lsquoDrsquo नाम स row नह ॊ तो row की values change हो गयी |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
c) Single value को change करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltColNamegt[ltRowNameLebelgt]
इसम D वाऱ row म lsquoThreersquo वाऱ column म value बदऱ गयी |
Values को ऐस भी change ककया जा सकता ह | सजसम row या column क अऱग अऱग values भी ददए जा सकत ह |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
Column को delete करन क हलए हनमन syntax का परयोग कर |
del ltDFObjectgt[ltColNamegt] या
dfdrop([ltCol1NamegtltCol2Namegt ] axis=1)
axis =1 यह बताता ह की column को delete करना ह
del कमाॊड delete करन क बाद value return नह ॊ करता ह जबकक drop method delete करन क बाद तरॊत बची हई dataframe को return करता ह|
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Pandas Series bull Pandas की primary building block Series ही होती ह |
bull Series एक labeled One-Dimensional Array होती ह जो ककसी भी data type को
hold कर सकती ह |
bull Series का data हमशा mutable होता ह ऄथाणत आनको बदला जा सकता ह |
bull लककन Series क data का size immutable होता ह |
bull यह एक परकार स 2 arrays का structure परतीत होता ह हजसम एक index होता ह और दसर
म actual values
bull Series म row labels को index कहा जाता ह |
bull हनमन ईदहारर data types ह हजनस series बनाइ जा सकती ह और ऐसा करन क हलए
series() का परयोग ककया जाता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Series Objects को बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ndash एक series type object को कइ तरीको स बनाया जा सकता ह |
1 Series ( ) फकशन का परयोग करक -
ltSeries Objectgt = pandasSeries( ) यह empty series बनाएगा |
2 Non-empty series बनाना ndash
Import pandas as pd
ltSeries Objectgt = pdSeries(data index=idx) जहाा data कोइ भी
python sequence ndarray python dictionary या scaler value हो सकता ह |
Index Index
Series Objects को बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
1 Dictionary क साथ series बनाना
2 Scalar value क साथ series बनाना -
Index of Keys
Series Object Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
3 कि common attributes हनमन ह-
ltseries objectgtltAttributeNamegt
Attribute Description Seriesindex Returns index of the series
Seriesvalues Returns ndarray
Seriesdtype Returns dtype object of the underlying data
Seriesshape Returns tuple of the shape of underlying data
Seriesnbytes Return number of bytes of underlying data
Seriesndim Returns the number of dimention
Seriessize Returns number of elements
Seriesintemsize Returns the size of the dtype
Serieshasnans Returns true if there are any NaN
Seriesempty Returns true if series object is empty
Series Object Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
Series Object को access करना
सॊजीव भदौररया क० वव० बाराबॊकी
Individual value को print करना
ऑबजकट की values को print करना
Objects की slicing
Objects की slicing करना बहत आसान ह बस ननमन syntax का अनसरण कररए ltobjectNamegt[ltstartgtltstopgtltstep gt]
head() और tail () Function
सॊजीव भदौररया क० वव० बाराबॊकी
1 head(ltngt ) function शर स n elements return करता ह यकद n न द
तो ऄपन अप शर क 5 record कदखायगा |
2 tail(ltngt ) function अहखरी स n elements return करता ह यकद n न द
तो ऄपन अप अहखरी क 5 record कदखायगा |
NumPy array और Series objects म ऄतर
सॊजीव भदौररया क० वव० बाराबॊकी
1 ndarray क case म अप तभी vector operation कर सकत ह
जब दोनो ndarray क shape सामान हो | जबकक series
ऑबजकट क कस म ऄगर मचिग index क साथ ही align होगा
ऄनयथा NaN return होता ह |
2 ndarray म index हमशा 0 स शर होता ह और सदव numeric
ही होगा |लककन series म numbers क अलावा ककसी भी type
का index हो सकता ह और ज़ररी नही की index 0 स शर हो |
DataFrame bull Pandas का मखय object DataFrame होता ह | और यह pandas का सबस ऄहधक परयोग
ककया जान वाला Data Structure ह |
bull DataFrame एक Two -Dimensional Array होता ह जो ककसी भी data type को hold
कर सकती ह | और यह tabular format म data को store करता ह |
bull Finance Statistics Social Science और कइ engineering branch म आसका परयोग
ऄहधकता म ककया जाता ह |
bull DataFrame म data और आसका size दोनो ही mutable होत ह ऄथाणत आनह बदला जा
सकता ह |
bull DataFrame म दो हवहभनन indexes होत ह - row index और column index |
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame को बनाना और परदरशशत करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull 2 D फॉमट म डाटा को pass करक एक DataFrame object बनाया जा
सकता ह |
import pandas as pd ltdataFrameObjectgt = pdDataFrame(lta 2D Data Structuregt [columns=ltcolumn
sequencegt][index=ltindex sequencegt])
bull अप DataFrame को कइ तरीक स data values pass करक बना सकत ह
जस ndash
bull 2D dictionaries
bull 2D ndarrays
bull Series type object
bull Another DataFrame object
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदाहरर म index सवतः 0 स
5 तक अगय तथा column क name
सवतः वाही अय जो dictionary म
keys थी |
2D Dictionary क keys column क
नाम हो गए
nprange(n) का
परयोग करक indexes
सवतः हनरशमत हो गयी |
A List या ndarrays की dictionary स DataFrame बनाना |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा indexes अपन
specify ककय ह |
ऄथाणत यकद अप index का sequence दत ह तो index अपक दवारा
कदया गया ही set होगा ऄनयथा वह सवतः 0 स n-1 तक का index
ललगा |
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की
dictionaries स हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
B Dictionaries की dictionary स DataFrame बनाना |
यहाा अप index और column
name दख कर समझ सकत ह
की कस assign हए
यकद यहाा yr2015 yr2016 और yr2017 क keys
ऄलग होत तो dataframe क rows और column
जयादा बढ़ जात और हबना match वाल row और
column म NaN store हो जाता |
2D ndarray स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
आसम column name और index सवतः ऄगय|
आसम column name user न कदए ह |
आसम column name तथा index दोनो
user न कदए ह |
Series Object की 2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की Series स
हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
DataFrame ऑबजकट को आस परकार भी
बनाया जा सकता ह |
दसर DataFrame ऑबजकट स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame ऑबजकट को दसर
DataFrame ऑबजकट स बनाया गया ह|
DataFrame ऑबजकट को display करना| DataFrame ऑबजकट
को display करन का
syntax य ह |
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
bull जब अप एक DataFrame ऑबजकट बनात ह तो आसस समबहधत समसत सिना जस
- size आसका datatype आतयाकद attributes क दवारा परापत ककय जा सकत ह |
ltDataFrame Objectgtltattribute namegt
bull कि attributes हनमन ह -
Attribute Description
index यह dataframe क index मतऱब (row lebels) को ददखता ह | columns यह dataframe क column lebels को ददखता ह | axes यह दोनो axes अथाात index और column को return करता ह | dtypes यह dataframe क अनदर रख डाटा का datatype return करता ह| size ऑबजकट म उपसथथत elements की सॊखया return करता ह | shape यह dataframe की dimention की tuple return करता ह | values यह dataframe का numpy रप return करता ह | empty यह एक सचक ह की dataframe empty ह या नह ॊ| ndim यह axesarray की dimention को return करता ह | T यह index और column को transpose कर दता ह|
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame स Selecting और Accessing
सॊजीव भदौररया क० वव० बाराबॊकी
bull Column को select करना
ltDataFrame Objectgt[ltcolumn namegt]
या ltDataFrame Objectgtltcolumn namegt
ltDataFrame Objectgt[column name की list ]
एक column को select करन क लऱए
कई column को select करन क लऱए
कई column म हम करम बदऱ सकत ह|
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgtloc [ltStartRowgt ltEndRowgt ltStartColgt ltEndColgt]
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgt iloc [ltRow Indexgt ltRowIndexgt ltColIndexgt ltColIndexgt]
DataFrame स Individual Value को select करना ltDFObjectgt ltcol name[row name or row index]
या
ltDFObjectgt at [ltrow namegtltcol namegt]
या
ltDFObjectgt iat[ltrow indexgt ltcol indexgt]
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
a) नए column को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltCol Namegt[ltrow labelgt]=ltnew valuegt
चॉकक इसम lsquoFourrsquo नाम स कोई column नह ॊ ह तो नया column add हो गया |
चॉकक इसम lsquoFourrsquo नाम स column ह तो column क मानो म बदऱाव हो गया |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
b) नए row को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgt at[ltRowNamegt ] =ltnew valuegt
या
ltDFObjectgt loc[ltRowNamegt ] =ltnew valuegt
चॉकक इसम lsquoDrsquo नाम स कोई row नह ॊ थी तो नयी row add हो गयी |
चॉकक इसम lsquoDrsquo नाम स row नह ॊ तो row की values change हो गयी |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
c) Single value को change करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltColNamegt[ltRowNameLebelgt]
इसम D वाऱ row म lsquoThreersquo वाऱ column म value बदऱ गयी |
Values को ऐस भी change ककया जा सकता ह | सजसम row या column क अऱग अऱग values भी ददए जा सकत ह |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
Column को delete करन क हलए हनमन syntax का परयोग कर |
del ltDFObjectgt[ltColNamegt] या
dfdrop([ltCol1NamegtltCol2Namegt ] axis=1)
axis =1 यह बताता ह की column को delete करना ह
del कमाॊड delete करन क बाद value return नह ॊ करता ह जबकक drop method delete करन क बाद तरॊत बची हई dataframe को return करता ह|
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Series Objects को बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ndash एक series type object को कइ तरीको स बनाया जा सकता ह |
1 Series ( ) फकशन का परयोग करक -
ltSeries Objectgt = pandasSeries( ) यह empty series बनाएगा |
2 Non-empty series बनाना ndash
Import pandas as pd
ltSeries Objectgt = pdSeries(data index=idx) जहाा data कोइ भी
python sequence ndarray python dictionary या scaler value हो सकता ह |
Index Index
Series Objects को बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
1 Dictionary क साथ series बनाना
2 Scalar value क साथ series बनाना -
Index of Keys
Series Object Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
3 कि common attributes हनमन ह-
ltseries objectgtltAttributeNamegt
Attribute Description Seriesindex Returns index of the series
Seriesvalues Returns ndarray
Seriesdtype Returns dtype object of the underlying data
Seriesshape Returns tuple of the shape of underlying data
Seriesnbytes Return number of bytes of underlying data
Seriesndim Returns the number of dimention
Seriessize Returns number of elements
Seriesintemsize Returns the size of the dtype
Serieshasnans Returns true if there are any NaN
Seriesempty Returns true if series object is empty
Series Object Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
Series Object को access करना
सॊजीव भदौररया क० वव० बाराबॊकी
Individual value को print करना
ऑबजकट की values को print करना
Objects की slicing
Objects की slicing करना बहत आसान ह बस ननमन syntax का अनसरण कररए ltobjectNamegt[ltstartgtltstopgtltstep gt]
head() और tail () Function
सॊजीव भदौररया क० वव० बाराबॊकी
1 head(ltngt ) function शर स n elements return करता ह यकद n न द
तो ऄपन अप शर क 5 record कदखायगा |
2 tail(ltngt ) function अहखरी स n elements return करता ह यकद n न द
तो ऄपन अप अहखरी क 5 record कदखायगा |
NumPy array और Series objects म ऄतर
सॊजीव भदौररया क० वव० बाराबॊकी
1 ndarray क case म अप तभी vector operation कर सकत ह
जब दोनो ndarray क shape सामान हो | जबकक series
ऑबजकट क कस म ऄगर मचिग index क साथ ही align होगा
ऄनयथा NaN return होता ह |
2 ndarray म index हमशा 0 स शर होता ह और सदव numeric
ही होगा |लककन series म numbers क अलावा ककसी भी type
का index हो सकता ह और ज़ररी नही की index 0 स शर हो |
DataFrame bull Pandas का मखय object DataFrame होता ह | और यह pandas का सबस ऄहधक परयोग
ककया जान वाला Data Structure ह |
bull DataFrame एक Two -Dimensional Array होता ह जो ककसी भी data type को hold
कर सकती ह | और यह tabular format म data को store करता ह |
bull Finance Statistics Social Science और कइ engineering branch म आसका परयोग
ऄहधकता म ककया जाता ह |
bull DataFrame म data और आसका size दोनो ही mutable होत ह ऄथाणत आनह बदला जा
सकता ह |
bull DataFrame म दो हवहभनन indexes होत ह - row index और column index |
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame को बनाना और परदरशशत करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull 2 D फॉमट म डाटा को pass करक एक DataFrame object बनाया जा
सकता ह |
import pandas as pd ltdataFrameObjectgt = pdDataFrame(lta 2D Data Structuregt [columns=ltcolumn
sequencegt][index=ltindex sequencegt])
bull अप DataFrame को कइ तरीक स data values pass करक बना सकत ह
जस ndash
bull 2D dictionaries
bull 2D ndarrays
bull Series type object
bull Another DataFrame object
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदाहरर म index सवतः 0 स
5 तक अगय तथा column क name
सवतः वाही अय जो dictionary म
keys थी |
2D Dictionary क keys column क
नाम हो गए
nprange(n) का
परयोग करक indexes
सवतः हनरशमत हो गयी |
A List या ndarrays की dictionary स DataFrame बनाना |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा indexes अपन
specify ककय ह |
ऄथाणत यकद अप index का sequence दत ह तो index अपक दवारा
कदया गया ही set होगा ऄनयथा वह सवतः 0 स n-1 तक का index
ललगा |
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की
dictionaries स हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
B Dictionaries की dictionary स DataFrame बनाना |
यहाा अप index और column
name दख कर समझ सकत ह
की कस assign हए
यकद यहाा yr2015 yr2016 और yr2017 क keys
ऄलग होत तो dataframe क rows और column
जयादा बढ़ जात और हबना match वाल row और
column म NaN store हो जाता |
2D ndarray स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
आसम column name और index सवतः ऄगय|
आसम column name user न कदए ह |
आसम column name तथा index दोनो
user न कदए ह |
Series Object की 2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की Series स
हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
DataFrame ऑबजकट को आस परकार भी
बनाया जा सकता ह |
दसर DataFrame ऑबजकट स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame ऑबजकट को दसर
DataFrame ऑबजकट स बनाया गया ह|
DataFrame ऑबजकट को display करना| DataFrame ऑबजकट
को display करन का
syntax य ह |
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
bull जब अप एक DataFrame ऑबजकट बनात ह तो आसस समबहधत समसत सिना जस
- size आसका datatype आतयाकद attributes क दवारा परापत ककय जा सकत ह |
ltDataFrame Objectgtltattribute namegt
bull कि attributes हनमन ह -
Attribute Description
index यह dataframe क index मतऱब (row lebels) को ददखता ह | columns यह dataframe क column lebels को ददखता ह | axes यह दोनो axes अथाात index और column को return करता ह | dtypes यह dataframe क अनदर रख डाटा का datatype return करता ह| size ऑबजकट म उपसथथत elements की सॊखया return करता ह | shape यह dataframe की dimention की tuple return करता ह | values यह dataframe का numpy रप return करता ह | empty यह एक सचक ह की dataframe empty ह या नह ॊ| ndim यह axesarray की dimention को return करता ह | T यह index और column को transpose कर दता ह|
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame स Selecting और Accessing
सॊजीव भदौररया क० वव० बाराबॊकी
bull Column को select करना
ltDataFrame Objectgt[ltcolumn namegt]
या ltDataFrame Objectgtltcolumn namegt
ltDataFrame Objectgt[column name की list ]
एक column को select करन क लऱए
कई column को select करन क लऱए
कई column म हम करम बदऱ सकत ह|
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgtloc [ltStartRowgt ltEndRowgt ltStartColgt ltEndColgt]
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgt iloc [ltRow Indexgt ltRowIndexgt ltColIndexgt ltColIndexgt]
DataFrame स Individual Value को select करना ltDFObjectgt ltcol name[row name or row index]
या
ltDFObjectgt at [ltrow namegtltcol namegt]
या
ltDFObjectgt iat[ltrow indexgt ltcol indexgt]
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
a) नए column को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltCol Namegt[ltrow labelgt]=ltnew valuegt
चॉकक इसम lsquoFourrsquo नाम स कोई column नह ॊ ह तो नया column add हो गया |
चॉकक इसम lsquoFourrsquo नाम स column ह तो column क मानो म बदऱाव हो गया |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
b) नए row को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgt at[ltRowNamegt ] =ltnew valuegt
या
ltDFObjectgt loc[ltRowNamegt ] =ltnew valuegt
चॉकक इसम lsquoDrsquo नाम स कोई row नह ॊ थी तो नयी row add हो गयी |
चॉकक इसम lsquoDrsquo नाम स row नह ॊ तो row की values change हो गयी |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
c) Single value को change करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltColNamegt[ltRowNameLebelgt]
इसम D वाऱ row म lsquoThreersquo वाऱ column म value बदऱ गयी |
Values को ऐस भी change ककया जा सकता ह | सजसम row या column क अऱग अऱग values भी ददए जा सकत ह |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
Column को delete करन क हलए हनमन syntax का परयोग कर |
del ltDFObjectgt[ltColNamegt] या
dfdrop([ltCol1NamegtltCol2Namegt ] axis=1)
axis =1 यह बताता ह की column को delete करना ह
del कमाॊड delete करन क बाद value return नह ॊ करता ह जबकक drop method delete करन क बाद तरॊत बची हई dataframe को return करता ह|
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Series Objects को बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
1 Dictionary क साथ series बनाना
2 Scalar value क साथ series बनाना -
Index of Keys
Series Object Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
3 कि common attributes हनमन ह-
ltseries objectgtltAttributeNamegt
Attribute Description Seriesindex Returns index of the series
Seriesvalues Returns ndarray
Seriesdtype Returns dtype object of the underlying data
Seriesshape Returns tuple of the shape of underlying data
Seriesnbytes Return number of bytes of underlying data
Seriesndim Returns the number of dimention
Seriessize Returns number of elements
Seriesintemsize Returns the size of the dtype
Serieshasnans Returns true if there are any NaN
Seriesempty Returns true if series object is empty
Series Object Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
Series Object को access करना
सॊजीव भदौररया क० वव० बाराबॊकी
Individual value को print करना
ऑबजकट की values को print करना
Objects की slicing
Objects की slicing करना बहत आसान ह बस ननमन syntax का अनसरण कररए ltobjectNamegt[ltstartgtltstopgtltstep gt]
head() और tail () Function
सॊजीव भदौररया क० वव० बाराबॊकी
1 head(ltngt ) function शर स n elements return करता ह यकद n न द
तो ऄपन अप शर क 5 record कदखायगा |
2 tail(ltngt ) function अहखरी स n elements return करता ह यकद n न द
तो ऄपन अप अहखरी क 5 record कदखायगा |
NumPy array और Series objects म ऄतर
सॊजीव भदौररया क० वव० बाराबॊकी
1 ndarray क case म अप तभी vector operation कर सकत ह
जब दोनो ndarray क shape सामान हो | जबकक series
ऑबजकट क कस म ऄगर मचिग index क साथ ही align होगा
ऄनयथा NaN return होता ह |
2 ndarray म index हमशा 0 स शर होता ह और सदव numeric
ही होगा |लककन series म numbers क अलावा ककसी भी type
का index हो सकता ह और ज़ररी नही की index 0 स शर हो |
DataFrame bull Pandas का मखय object DataFrame होता ह | और यह pandas का सबस ऄहधक परयोग
ककया जान वाला Data Structure ह |
bull DataFrame एक Two -Dimensional Array होता ह जो ककसी भी data type को hold
कर सकती ह | और यह tabular format म data को store करता ह |
bull Finance Statistics Social Science और कइ engineering branch म आसका परयोग
ऄहधकता म ककया जाता ह |
bull DataFrame म data और आसका size दोनो ही mutable होत ह ऄथाणत आनह बदला जा
सकता ह |
bull DataFrame म दो हवहभनन indexes होत ह - row index और column index |
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame को बनाना और परदरशशत करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull 2 D फॉमट म डाटा को pass करक एक DataFrame object बनाया जा
सकता ह |
import pandas as pd ltdataFrameObjectgt = pdDataFrame(lta 2D Data Structuregt [columns=ltcolumn
sequencegt][index=ltindex sequencegt])
bull अप DataFrame को कइ तरीक स data values pass करक बना सकत ह
जस ndash
bull 2D dictionaries
bull 2D ndarrays
bull Series type object
bull Another DataFrame object
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदाहरर म index सवतः 0 स
5 तक अगय तथा column क name
सवतः वाही अय जो dictionary म
keys थी |
2D Dictionary क keys column क
नाम हो गए
nprange(n) का
परयोग करक indexes
सवतः हनरशमत हो गयी |
A List या ndarrays की dictionary स DataFrame बनाना |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा indexes अपन
specify ककय ह |
ऄथाणत यकद अप index का sequence दत ह तो index अपक दवारा
कदया गया ही set होगा ऄनयथा वह सवतः 0 स n-1 तक का index
ललगा |
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की
dictionaries स हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
B Dictionaries की dictionary स DataFrame बनाना |
यहाा अप index और column
name दख कर समझ सकत ह
की कस assign हए
यकद यहाा yr2015 yr2016 और yr2017 क keys
ऄलग होत तो dataframe क rows और column
जयादा बढ़ जात और हबना match वाल row और
column म NaN store हो जाता |
2D ndarray स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
आसम column name और index सवतः ऄगय|
आसम column name user न कदए ह |
आसम column name तथा index दोनो
user न कदए ह |
Series Object की 2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की Series स
हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
DataFrame ऑबजकट को आस परकार भी
बनाया जा सकता ह |
दसर DataFrame ऑबजकट स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame ऑबजकट को दसर
DataFrame ऑबजकट स बनाया गया ह|
DataFrame ऑबजकट को display करना| DataFrame ऑबजकट
को display करन का
syntax य ह |
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
bull जब अप एक DataFrame ऑबजकट बनात ह तो आसस समबहधत समसत सिना जस
- size आसका datatype आतयाकद attributes क दवारा परापत ककय जा सकत ह |
ltDataFrame Objectgtltattribute namegt
bull कि attributes हनमन ह -
Attribute Description
index यह dataframe क index मतऱब (row lebels) को ददखता ह | columns यह dataframe क column lebels को ददखता ह | axes यह दोनो axes अथाात index और column को return करता ह | dtypes यह dataframe क अनदर रख डाटा का datatype return करता ह| size ऑबजकट म उपसथथत elements की सॊखया return करता ह | shape यह dataframe की dimention की tuple return करता ह | values यह dataframe का numpy रप return करता ह | empty यह एक सचक ह की dataframe empty ह या नह ॊ| ndim यह axesarray की dimention को return करता ह | T यह index और column को transpose कर दता ह|
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame स Selecting और Accessing
सॊजीव भदौररया क० वव० बाराबॊकी
bull Column को select करना
ltDataFrame Objectgt[ltcolumn namegt]
या ltDataFrame Objectgtltcolumn namegt
ltDataFrame Objectgt[column name की list ]
एक column को select करन क लऱए
कई column को select करन क लऱए
कई column म हम करम बदऱ सकत ह|
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgtloc [ltStartRowgt ltEndRowgt ltStartColgt ltEndColgt]
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgt iloc [ltRow Indexgt ltRowIndexgt ltColIndexgt ltColIndexgt]
DataFrame स Individual Value को select करना ltDFObjectgt ltcol name[row name or row index]
या
ltDFObjectgt at [ltrow namegtltcol namegt]
या
ltDFObjectgt iat[ltrow indexgt ltcol indexgt]
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
a) नए column को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltCol Namegt[ltrow labelgt]=ltnew valuegt
चॉकक इसम lsquoFourrsquo नाम स कोई column नह ॊ ह तो नया column add हो गया |
चॉकक इसम lsquoFourrsquo नाम स column ह तो column क मानो म बदऱाव हो गया |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
b) नए row को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgt at[ltRowNamegt ] =ltnew valuegt
या
ltDFObjectgt loc[ltRowNamegt ] =ltnew valuegt
चॉकक इसम lsquoDrsquo नाम स कोई row नह ॊ थी तो नयी row add हो गयी |
चॉकक इसम lsquoDrsquo नाम स row नह ॊ तो row की values change हो गयी |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
c) Single value को change करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltColNamegt[ltRowNameLebelgt]
इसम D वाऱ row म lsquoThreersquo वाऱ column म value बदऱ गयी |
Values को ऐस भी change ककया जा सकता ह | सजसम row या column क अऱग अऱग values भी ददए जा सकत ह |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
Column को delete करन क हलए हनमन syntax का परयोग कर |
del ltDFObjectgt[ltColNamegt] या
dfdrop([ltCol1NamegtltCol2Namegt ] axis=1)
axis =1 यह बताता ह की column को delete करना ह
del कमाॊड delete करन क बाद value return नह ॊ करता ह जबकक drop method delete करन क बाद तरॊत बची हई dataframe को return करता ह|
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Series Object Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
3 कि common attributes हनमन ह-
ltseries objectgtltAttributeNamegt
Attribute Description Seriesindex Returns index of the series
Seriesvalues Returns ndarray
Seriesdtype Returns dtype object of the underlying data
Seriesshape Returns tuple of the shape of underlying data
Seriesnbytes Return number of bytes of underlying data
Seriesndim Returns the number of dimention
Seriessize Returns number of elements
Seriesintemsize Returns the size of the dtype
Serieshasnans Returns true if there are any NaN
Seriesempty Returns true if series object is empty
Series Object Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
Series Object को access करना
सॊजीव भदौररया क० वव० बाराबॊकी
Individual value को print करना
ऑबजकट की values को print करना
Objects की slicing
Objects की slicing करना बहत आसान ह बस ननमन syntax का अनसरण कररए ltobjectNamegt[ltstartgtltstopgtltstep gt]
head() और tail () Function
सॊजीव भदौररया क० वव० बाराबॊकी
1 head(ltngt ) function शर स n elements return करता ह यकद n न द
तो ऄपन अप शर क 5 record कदखायगा |
2 tail(ltngt ) function अहखरी स n elements return करता ह यकद n न द
तो ऄपन अप अहखरी क 5 record कदखायगा |
NumPy array और Series objects म ऄतर
सॊजीव भदौररया क० वव० बाराबॊकी
1 ndarray क case म अप तभी vector operation कर सकत ह
जब दोनो ndarray क shape सामान हो | जबकक series
ऑबजकट क कस म ऄगर मचिग index क साथ ही align होगा
ऄनयथा NaN return होता ह |
2 ndarray म index हमशा 0 स शर होता ह और सदव numeric
ही होगा |लककन series म numbers क अलावा ककसी भी type
का index हो सकता ह और ज़ररी नही की index 0 स शर हो |
DataFrame bull Pandas का मखय object DataFrame होता ह | और यह pandas का सबस ऄहधक परयोग
ककया जान वाला Data Structure ह |
bull DataFrame एक Two -Dimensional Array होता ह जो ककसी भी data type को hold
कर सकती ह | और यह tabular format म data को store करता ह |
bull Finance Statistics Social Science और कइ engineering branch म आसका परयोग
ऄहधकता म ककया जाता ह |
bull DataFrame म data और आसका size दोनो ही mutable होत ह ऄथाणत आनह बदला जा
सकता ह |
bull DataFrame म दो हवहभनन indexes होत ह - row index और column index |
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame को बनाना और परदरशशत करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull 2 D फॉमट म डाटा को pass करक एक DataFrame object बनाया जा
सकता ह |
import pandas as pd ltdataFrameObjectgt = pdDataFrame(lta 2D Data Structuregt [columns=ltcolumn
sequencegt][index=ltindex sequencegt])
bull अप DataFrame को कइ तरीक स data values pass करक बना सकत ह
जस ndash
bull 2D dictionaries
bull 2D ndarrays
bull Series type object
bull Another DataFrame object
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदाहरर म index सवतः 0 स
5 तक अगय तथा column क name
सवतः वाही अय जो dictionary म
keys थी |
2D Dictionary क keys column क
नाम हो गए
nprange(n) का
परयोग करक indexes
सवतः हनरशमत हो गयी |
A List या ndarrays की dictionary स DataFrame बनाना |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा indexes अपन
specify ककय ह |
ऄथाणत यकद अप index का sequence दत ह तो index अपक दवारा
कदया गया ही set होगा ऄनयथा वह सवतः 0 स n-1 तक का index
ललगा |
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की
dictionaries स हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
B Dictionaries की dictionary स DataFrame बनाना |
यहाा अप index और column
name दख कर समझ सकत ह
की कस assign हए
यकद यहाा yr2015 yr2016 और yr2017 क keys
ऄलग होत तो dataframe क rows और column
जयादा बढ़ जात और हबना match वाल row और
column म NaN store हो जाता |
2D ndarray स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
आसम column name और index सवतः ऄगय|
आसम column name user न कदए ह |
आसम column name तथा index दोनो
user न कदए ह |
Series Object की 2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की Series स
हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
DataFrame ऑबजकट को आस परकार भी
बनाया जा सकता ह |
दसर DataFrame ऑबजकट स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame ऑबजकट को दसर
DataFrame ऑबजकट स बनाया गया ह|
DataFrame ऑबजकट को display करना| DataFrame ऑबजकट
को display करन का
syntax य ह |
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
bull जब अप एक DataFrame ऑबजकट बनात ह तो आसस समबहधत समसत सिना जस
- size आसका datatype आतयाकद attributes क दवारा परापत ककय जा सकत ह |
ltDataFrame Objectgtltattribute namegt
bull कि attributes हनमन ह -
Attribute Description
index यह dataframe क index मतऱब (row lebels) को ददखता ह | columns यह dataframe क column lebels को ददखता ह | axes यह दोनो axes अथाात index और column को return करता ह | dtypes यह dataframe क अनदर रख डाटा का datatype return करता ह| size ऑबजकट म उपसथथत elements की सॊखया return करता ह | shape यह dataframe की dimention की tuple return करता ह | values यह dataframe का numpy रप return करता ह | empty यह एक सचक ह की dataframe empty ह या नह ॊ| ndim यह axesarray की dimention को return करता ह | T यह index और column को transpose कर दता ह|
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame स Selecting और Accessing
सॊजीव भदौररया क० वव० बाराबॊकी
bull Column को select करना
ltDataFrame Objectgt[ltcolumn namegt]
या ltDataFrame Objectgtltcolumn namegt
ltDataFrame Objectgt[column name की list ]
एक column को select करन क लऱए
कई column को select करन क लऱए
कई column म हम करम बदऱ सकत ह|
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgtloc [ltStartRowgt ltEndRowgt ltStartColgt ltEndColgt]
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgt iloc [ltRow Indexgt ltRowIndexgt ltColIndexgt ltColIndexgt]
DataFrame स Individual Value को select करना ltDFObjectgt ltcol name[row name or row index]
या
ltDFObjectgt at [ltrow namegtltcol namegt]
या
ltDFObjectgt iat[ltrow indexgt ltcol indexgt]
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
a) नए column को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltCol Namegt[ltrow labelgt]=ltnew valuegt
चॉकक इसम lsquoFourrsquo नाम स कोई column नह ॊ ह तो नया column add हो गया |
चॉकक इसम lsquoFourrsquo नाम स column ह तो column क मानो म बदऱाव हो गया |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
b) नए row को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgt at[ltRowNamegt ] =ltnew valuegt
या
ltDFObjectgt loc[ltRowNamegt ] =ltnew valuegt
चॉकक इसम lsquoDrsquo नाम स कोई row नह ॊ थी तो नयी row add हो गयी |
चॉकक इसम lsquoDrsquo नाम स row नह ॊ तो row की values change हो गयी |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
c) Single value को change करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltColNamegt[ltRowNameLebelgt]
इसम D वाऱ row म lsquoThreersquo वाऱ column म value बदऱ गयी |
Values को ऐस भी change ककया जा सकता ह | सजसम row या column क अऱग अऱग values भी ददए जा सकत ह |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
Column को delete करन क हलए हनमन syntax का परयोग कर |
del ltDFObjectgt[ltColNamegt] या
dfdrop([ltCol1NamegtltCol2Namegt ] axis=1)
axis =1 यह बताता ह की column को delete करना ह
del कमाॊड delete करन क बाद value return नह ॊ करता ह जबकक drop method delete करन क बाद तरॊत बची हई dataframe को return करता ह|
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Series Object Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
Series Object को access करना
सॊजीव भदौररया क० वव० बाराबॊकी
Individual value को print करना
ऑबजकट की values को print करना
Objects की slicing
Objects की slicing करना बहत आसान ह बस ननमन syntax का अनसरण कररए ltobjectNamegt[ltstartgtltstopgtltstep gt]
head() और tail () Function
सॊजीव भदौररया क० वव० बाराबॊकी
1 head(ltngt ) function शर स n elements return करता ह यकद n न द
तो ऄपन अप शर क 5 record कदखायगा |
2 tail(ltngt ) function अहखरी स n elements return करता ह यकद n न द
तो ऄपन अप अहखरी क 5 record कदखायगा |
NumPy array और Series objects म ऄतर
सॊजीव भदौररया क० वव० बाराबॊकी
1 ndarray क case म अप तभी vector operation कर सकत ह
जब दोनो ndarray क shape सामान हो | जबकक series
ऑबजकट क कस म ऄगर मचिग index क साथ ही align होगा
ऄनयथा NaN return होता ह |
2 ndarray म index हमशा 0 स शर होता ह और सदव numeric
ही होगा |लककन series म numbers क अलावा ककसी भी type
का index हो सकता ह और ज़ररी नही की index 0 स शर हो |
DataFrame bull Pandas का मखय object DataFrame होता ह | और यह pandas का सबस ऄहधक परयोग
ककया जान वाला Data Structure ह |
bull DataFrame एक Two -Dimensional Array होता ह जो ककसी भी data type को hold
कर सकती ह | और यह tabular format म data को store करता ह |
bull Finance Statistics Social Science और कइ engineering branch म आसका परयोग
ऄहधकता म ककया जाता ह |
bull DataFrame म data और आसका size दोनो ही mutable होत ह ऄथाणत आनह बदला जा
सकता ह |
bull DataFrame म दो हवहभनन indexes होत ह - row index और column index |
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame को बनाना और परदरशशत करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull 2 D फॉमट म डाटा को pass करक एक DataFrame object बनाया जा
सकता ह |
import pandas as pd ltdataFrameObjectgt = pdDataFrame(lta 2D Data Structuregt [columns=ltcolumn
sequencegt][index=ltindex sequencegt])
bull अप DataFrame को कइ तरीक स data values pass करक बना सकत ह
जस ndash
bull 2D dictionaries
bull 2D ndarrays
bull Series type object
bull Another DataFrame object
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदाहरर म index सवतः 0 स
5 तक अगय तथा column क name
सवतः वाही अय जो dictionary म
keys थी |
2D Dictionary क keys column क
नाम हो गए
nprange(n) का
परयोग करक indexes
सवतः हनरशमत हो गयी |
A List या ndarrays की dictionary स DataFrame बनाना |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा indexes अपन
specify ककय ह |
ऄथाणत यकद अप index का sequence दत ह तो index अपक दवारा
कदया गया ही set होगा ऄनयथा वह सवतः 0 स n-1 तक का index
ललगा |
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की
dictionaries स हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
B Dictionaries की dictionary स DataFrame बनाना |
यहाा अप index और column
name दख कर समझ सकत ह
की कस assign हए
यकद यहाा yr2015 yr2016 और yr2017 क keys
ऄलग होत तो dataframe क rows और column
जयादा बढ़ जात और हबना match वाल row और
column म NaN store हो जाता |
2D ndarray स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
आसम column name और index सवतः ऄगय|
आसम column name user न कदए ह |
आसम column name तथा index दोनो
user न कदए ह |
Series Object की 2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की Series स
हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
DataFrame ऑबजकट को आस परकार भी
बनाया जा सकता ह |
दसर DataFrame ऑबजकट स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame ऑबजकट को दसर
DataFrame ऑबजकट स बनाया गया ह|
DataFrame ऑबजकट को display करना| DataFrame ऑबजकट
को display करन का
syntax य ह |
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
bull जब अप एक DataFrame ऑबजकट बनात ह तो आसस समबहधत समसत सिना जस
- size आसका datatype आतयाकद attributes क दवारा परापत ककय जा सकत ह |
ltDataFrame Objectgtltattribute namegt
bull कि attributes हनमन ह -
Attribute Description
index यह dataframe क index मतऱब (row lebels) को ददखता ह | columns यह dataframe क column lebels को ददखता ह | axes यह दोनो axes अथाात index और column को return करता ह | dtypes यह dataframe क अनदर रख डाटा का datatype return करता ह| size ऑबजकट म उपसथथत elements की सॊखया return करता ह | shape यह dataframe की dimention की tuple return करता ह | values यह dataframe का numpy रप return करता ह | empty यह एक सचक ह की dataframe empty ह या नह ॊ| ndim यह axesarray की dimention को return करता ह | T यह index और column को transpose कर दता ह|
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame स Selecting और Accessing
सॊजीव भदौररया क० वव० बाराबॊकी
bull Column को select करना
ltDataFrame Objectgt[ltcolumn namegt]
या ltDataFrame Objectgtltcolumn namegt
ltDataFrame Objectgt[column name की list ]
एक column को select करन क लऱए
कई column को select करन क लऱए
कई column म हम करम बदऱ सकत ह|
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgtloc [ltStartRowgt ltEndRowgt ltStartColgt ltEndColgt]
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgt iloc [ltRow Indexgt ltRowIndexgt ltColIndexgt ltColIndexgt]
DataFrame स Individual Value को select करना ltDFObjectgt ltcol name[row name or row index]
या
ltDFObjectgt at [ltrow namegtltcol namegt]
या
ltDFObjectgt iat[ltrow indexgt ltcol indexgt]
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
a) नए column को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltCol Namegt[ltrow labelgt]=ltnew valuegt
चॉकक इसम lsquoFourrsquo नाम स कोई column नह ॊ ह तो नया column add हो गया |
चॉकक इसम lsquoFourrsquo नाम स column ह तो column क मानो म बदऱाव हो गया |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
b) नए row को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgt at[ltRowNamegt ] =ltnew valuegt
या
ltDFObjectgt loc[ltRowNamegt ] =ltnew valuegt
चॉकक इसम lsquoDrsquo नाम स कोई row नह ॊ थी तो नयी row add हो गयी |
चॉकक इसम lsquoDrsquo नाम स row नह ॊ तो row की values change हो गयी |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
c) Single value को change करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltColNamegt[ltRowNameLebelgt]
इसम D वाऱ row म lsquoThreersquo वाऱ column म value बदऱ गयी |
Values को ऐस भी change ककया जा सकता ह | सजसम row या column क अऱग अऱग values भी ददए जा सकत ह |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
Column को delete करन क हलए हनमन syntax का परयोग कर |
del ltDFObjectgt[ltColNamegt] या
dfdrop([ltCol1NamegtltCol2Namegt ] axis=1)
axis =1 यह बताता ह की column को delete करना ह
del कमाॊड delete करन क बाद value return नह ॊ करता ह जबकक drop method delete करन क बाद तरॊत बची हई dataframe को return करता ह|
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Series Object को access करना
सॊजीव भदौररया क० वव० बाराबॊकी
Individual value को print करना
ऑबजकट की values को print करना
Objects की slicing
Objects की slicing करना बहत आसान ह बस ननमन syntax का अनसरण कररए ltobjectNamegt[ltstartgtltstopgtltstep gt]
head() और tail () Function
सॊजीव भदौररया क० वव० बाराबॊकी
1 head(ltngt ) function शर स n elements return करता ह यकद n न द
तो ऄपन अप शर क 5 record कदखायगा |
2 tail(ltngt ) function अहखरी स n elements return करता ह यकद n न द
तो ऄपन अप अहखरी क 5 record कदखायगा |
NumPy array और Series objects म ऄतर
सॊजीव भदौररया क० वव० बाराबॊकी
1 ndarray क case म अप तभी vector operation कर सकत ह
जब दोनो ndarray क shape सामान हो | जबकक series
ऑबजकट क कस म ऄगर मचिग index क साथ ही align होगा
ऄनयथा NaN return होता ह |
2 ndarray म index हमशा 0 स शर होता ह और सदव numeric
ही होगा |लककन series म numbers क अलावा ककसी भी type
का index हो सकता ह और ज़ररी नही की index 0 स शर हो |
DataFrame bull Pandas का मखय object DataFrame होता ह | और यह pandas का सबस ऄहधक परयोग
ककया जान वाला Data Structure ह |
bull DataFrame एक Two -Dimensional Array होता ह जो ककसी भी data type को hold
कर सकती ह | और यह tabular format म data को store करता ह |
bull Finance Statistics Social Science और कइ engineering branch म आसका परयोग
ऄहधकता म ककया जाता ह |
bull DataFrame म data और आसका size दोनो ही mutable होत ह ऄथाणत आनह बदला जा
सकता ह |
bull DataFrame म दो हवहभनन indexes होत ह - row index और column index |
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame को बनाना और परदरशशत करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull 2 D फॉमट म डाटा को pass करक एक DataFrame object बनाया जा
सकता ह |
import pandas as pd ltdataFrameObjectgt = pdDataFrame(lta 2D Data Structuregt [columns=ltcolumn
sequencegt][index=ltindex sequencegt])
bull अप DataFrame को कइ तरीक स data values pass करक बना सकत ह
जस ndash
bull 2D dictionaries
bull 2D ndarrays
bull Series type object
bull Another DataFrame object
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदाहरर म index सवतः 0 स
5 तक अगय तथा column क name
सवतः वाही अय जो dictionary म
keys थी |
2D Dictionary क keys column क
नाम हो गए
nprange(n) का
परयोग करक indexes
सवतः हनरशमत हो गयी |
A List या ndarrays की dictionary स DataFrame बनाना |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा indexes अपन
specify ककय ह |
ऄथाणत यकद अप index का sequence दत ह तो index अपक दवारा
कदया गया ही set होगा ऄनयथा वह सवतः 0 स n-1 तक का index
ललगा |
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की
dictionaries स हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
B Dictionaries की dictionary स DataFrame बनाना |
यहाा अप index और column
name दख कर समझ सकत ह
की कस assign हए
यकद यहाा yr2015 yr2016 और yr2017 क keys
ऄलग होत तो dataframe क rows और column
जयादा बढ़ जात और हबना match वाल row और
column म NaN store हो जाता |
2D ndarray स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
आसम column name और index सवतः ऄगय|
आसम column name user न कदए ह |
आसम column name तथा index दोनो
user न कदए ह |
Series Object की 2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की Series स
हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
DataFrame ऑबजकट को आस परकार भी
बनाया जा सकता ह |
दसर DataFrame ऑबजकट स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame ऑबजकट को दसर
DataFrame ऑबजकट स बनाया गया ह|
DataFrame ऑबजकट को display करना| DataFrame ऑबजकट
को display करन का
syntax य ह |
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
bull जब अप एक DataFrame ऑबजकट बनात ह तो आसस समबहधत समसत सिना जस
- size आसका datatype आतयाकद attributes क दवारा परापत ककय जा सकत ह |
ltDataFrame Objectgtltattribute namegt
bull कि attributes हनमन ह -
Attribute Description
index यह dataframe क index मतऱब (row lebels) को ददखता ह | columns यह dataframe क column lebels को ददखता ह | axes यह दोनो axes अथाात index और column को return करता ह | dtypes यह dataframe क अनदर रख डाटा का datatype return करता ह| size ऑबजकट म उपसथथत elements की सॊखया return करता ह | shape यह dataframe की dimention की tuple return करता ह | values यह dataframe का numpy रप return करता ह | empty यह एक सचक ह की dataframe empty ह या नह ॊ| ndim यह axesarray की dimention को return करता ह | T यह index और column को transpose कर दता ह|
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame स Selecting और Accessing
सॊजीव भदौररया क० वव० बाराबॊकी
bull Column को select करना
ltDataFrame Objectgt[ltcolumn namegt]
या ltDataFrame Objectgtltcolumn namegt
ltDataFrame Objectgt[column name की list ]
एक column को select करन क लऱए
कई column को select करन क लऱए
कई column म हम करम बदऱ सकत ह|
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgtloc [ltStartRowgt ltEndRowgt ltStartColgt ltEndColgt]
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgt iloc [ltRow Indexgt ltRowIndexgt ltColIndexgt ltColIndexgt]
DataFrame स Individual Value को select करना ltDFObjectgt ltcol name[row name or row index]
या
ltDFObjectgt at [ltrow namegtltcol namegt]
या
ltDFObjectgt iat[ltrow indexgt ltcol indexgt]
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
a) नए column को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltCol Namegt[ltrow labelgt]=ltnew valuegt
चॉकक इसम lsquoFourrsquo नाम स कोई column नह ॊ ह तो नया column add हो गया |
चॉकक इसम lsquoFourrsquo नाम स column ह तो column क मानो म बदऱाव हो गया |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
b) नए row को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgt at[ltRowNamegt ] =ltnew valuegt
या
ltDFObjectgt loc[ltRowNamegt ] =ltnew valuegt
चॉकक इसम lsquoDrsquo नाम स कोई row नह ॊ थी तो नयी row add हो गयी |
चॉकक इसम lsquoDrsquo नाम स row नह ॊ तो row की values change हो गयी |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
c) Single value को change करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltColNamegt[ltRowNameLebelgt]
इसम D वाऱ row म lsquoThreersquo वाऱ column म value बदऱ गयी |
Values को ऐस भी change ककया जा सकता ह | सजसम row या column क अऱग अऱग values भी ददए जा सकत ह |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
Column को delete करन क हलए हनमन syntax का परयोग कर |
del ltDFObjectgt[ltColNamegt] या
dfdrop([ltCol1NamegtltCol2Namegt ] axis=1)
axis =1 यह बताता ह की column को delete करना ह
del कमाॊड delete करन क बाद value return नह ॊ करता ह जबकक drop method delete करन क बाद तरॊत बची हई dataframe को return करता ह|
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
head() और tail () Function
सॊजीव भदौररया क० वव० बाराबॊकी
1 head(ltngt ) function शर स n elements return करता ह यकद n न द
तो ऄपन अप शर क 5 record कदखायगा |
2 tail(ltngt ) function अहखरी स n elements return करता ह यकद n न द
तो ऄपन अप अहखरी क 5 record कदखायगा |
NumPy array और Series objects म ऄतर
सॊजीव भदौररया क० वव० बाराबॊकी
1 ndarray क case म अप तभी vector operation कर सकत ह
जब दोनो ndarray क shape सामान हो | जबकक series
ऑबजकट क कस म ऄगर मचिग index क साथ ही align होगा
ऄनयथा NaN return होता ह |
2 ndarray म index हमशा 0 स शर होता ह और सदव numeric
ही होगा |लककन series म numbers क अलावा ककसी भी type
का index हो सकता ह और ज़ररी नही की index 0 स शर हो |
DataFrame bull Pandas का मखय object DataFrame होता ह | और यह pandas का सबस ऄहधक परयोग
ककया जान वाला Data Structure ह |
bull DataFrame एक Two -Dimensional Array होता ह जो ककसी भी data type को hold
कर सकती ह | और यह tabular format म data को store करता ह |
bull Finance Statistics Social Science और कइ engineering branch म आसका परयोग
ऄहधकता म ककया जाता ह |
bull DataFrame म data और आसका size दोनो ही mutable होत ह ऄथाणत आनह बदला जा
सकता ह |
bull DataFrame म दो हवहभनन indexes होत ह - row index और column index |
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame को बनाना और परदरशशत करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull 2 D फॉमट म डाटा को pass करक एक DataFrame object बनाया जा
सकता ह |
import pandas as pd ltdataFrameObjectgt = pdDataFrame(lta 2D Data Structuregt [columns=ltcolumn
sequencegt][index=ltindex sequencegt])
bull अप DataFrame को कइ तरीक स data values pass करक बना सकत ह
जस ndash
bull 2D dictionaries
bull 2D ndarrays
bull Series type object
bull Another DataFrame object
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदाहरर म index सवतः 0 स
5 तक अगय तथा column क name
सवतः वाही अय जो dictionary म
keys थी |
2D Dictionary क keys column क
नाम हो गए
nprange(n) का
परयोग करक indexes
सवतः हनरशमत हो गयी |
A List या ndarrays की dictionary स DataFrame बनाना |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा indexes अपन
specify ककय ह |
ऄथाणत यकद अप index का sequence दत ह तो index अपक दवारा
कदया गया ही set होगा ऄनयथा वह सवतः 0 स n-1 तक का index
ललगा |
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की
dictionaries स हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
B Dictionaries की dictionary स DataFrame बनाना |
यहाा अप index और column
name दख कर समझ सकत ह
की कस assign हए
यकद यहाा yr2015 yr2016 और yr2017 क keys
ऄलग होत तो dataframe क rows और column
जयादा बढ़ जात और हबना match वाल row और
column म NaN store हो जाता |
2D ndarray स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
आसम column name और index सवतः ऄगय|
आसम column name user न कदए ह |
आसम column name तथा index दोनो
user न कदए ह |
Series Object की 2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की Series स
हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
DataFrame ऑबजकट को आस परकार भी
बनाया जा सकता ह |
दसर DataFrame ऑबजकट स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame ऑबजकट को दसर
DataFrame ऑबजकट स बनाया गया ह|
DataFrame ऑबजकट को display करना| DataFrame ऑबजकट
को display करन का
syntax य ह |
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
bull जब अप एक DataFrame ऑबजकट बनात ह तो आसस समबहधत समसत सिना जस
- size आसका datatype आतयाकद attributes क दवारा परापत ककय जा सकत ह |
ltDataFrame Objectgtltattribute namegt
bull कि attributes हनमन ह -
Attribute Description
index यह dataframe क index मतऱब (row lebels) को ददखता ह | columns यह dataframe क column lebels को ददखता ह | axes यह दोनो axes अथाात index और column को return करता ह | dtypes यह dataframe क अनदर रख डाटा का datatype return करता ह| size ऑबजकट म उपसथथत elements की सॊखया return करता ह | shape यह dataframe की dimention की tuple return करता ह | values यह dataframe का numpy रप return करता ह | empty यह एक सचक ह की dataframe empty ह या नह ॊ| ndim यह axesarray की dimention को return करता ह | T यह index और column को transpose कर दता ह|
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame स Selecting और Accessing
सॊजीव भदौररया क० वव० बाराबॊकी
bull Column को select करना
ltDataFrame Objectgt[ltcolumn namegt]
या ltDataFrame Objectgtltcolumn namegt
ltDataFrame Objectgt[column name की list ]
एक column को select करन क लऱए
कई column को select करन क लऱए
कई column म हम करम बदऱ सकत ह|
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgtloc [ltStartRowgt ltEndRowgt ltStartColgt ltEndColgt]
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgt iloc [ltRow Indexgt ltRowIndexgt ltColIndexgt ltColIndexgt]
DataFrame स Individual Value को select करना ltDFObjectgt ltcol name[row name or row index]
या
ltDFObjectgt at [ltrow namegtltcol namegt]
या
ltDFObjectgt iat[ltrow indexgt ltcol indexgt]
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
a) नए column को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltCol Namegt[ltrow labelgt]=ltnew valuegt
चॉकक इसम lsquoFourrsquo नाम स कोई column नह ॊ ह तो नया column add हो गया |
चॉकक इसम lsquoFourrsquo नाम स column ह तो column क मानो म बदऱाव हो गया |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
b) नए row को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgt at[ltRowNamegt ] =ltnew valuegt
या
ltDFObjectgt loc[ltRowNamegt ] =ltnew valuegt
चॉकक इसम lsquoDrsquo नाम स कोई row नह ॊ थी तो नयी row add हो गयी |
चॉकक इसम lsquoDrsquo नाम स row नह ॊ तो row की values change हो गयी |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
c) Single value को change करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltColNamegt[ltRowNameLebelgt]
इसम D वाऱ row म lsquoThreersquo वाऱ column म value बदऱ गयी |
Values को ऐस भी change ककया जा सकता ह | सजसम row या column क अऱग अऱग values भी ददए जा सकत ह |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
Column को delete करन क हलए हनमन syntax का परयोग कर |
del ltDFObjectgt[ltColNamegt] या
dfdrop([ltCol1NamegtltCol2Namegt ] axis=1)
axis =1 यह बताता ह की column को delete करना ह
del कमाॊड delete करन क बाद value return नह ॊ करता ह जबकक drop method delete करन क बाद तरॊत बची हई dataframe को return करता ह|
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
NumPy array और Series objects म ऄतर
सॊजीव भदौररया क० वव० बाराबॊकी
1 ndarray क case म अप तभी vector operation कर सकत ह
जब दोनो ndarray क shape सामान हो | जबकक series
ऑबजकट क कस म ऄगर मचिग index क साथ ही align होगा
ऄनयथा NaN return होता ह |
2 ndarray म index हमशा 0 स शर होता ह और सदव numeric
ही होगा |लककन series म numbers क अलावा ककसी भी type
का index हो सकता ह और ज़ररी नही की index 0 स शर हो |
DataFrame bull Pandas का मखय object DataFrame होता ह | और यह pandas का सबस ऄहधक परयोग
ककया जान वाला Data Structure ह |
bull DataFrame एक Two -Dimensional Array होता ह जो ककसी भी data type को hold
कर सकती ह | और यह tabular format म data को store करता ह |
bull Finance Statistics Social Science और कइ engineering branch म आसका परयोग
ऄहधकता म ककया जाता ह |
bull DataFrame म data और आसका size दोनो ही mutable होत ह ऄथाणत आनह बदला जा
सकता ह |
bull DataFrame म दो हवहभनन indexes होत ह - row index और column index |
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame को बनाना और परदरशशत करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull 2 D फॉमट म डाटा को pass करक एक DataFrame object बनाया जा
सकता ह |
import pandas as pd ltdataFrameObjectgt = pdDataFrame(lta 2D Data Structuregt [columns=ltcolumn
sequencegt][index=ltindex sequencegt])
bull अप DataFrame को कइ तरीक स data values pass करक बना सकत ह
जस ndash
bull 2D dictionaries
bull 2D ndarrays
bull Series type object
bull Another DataFrame object
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदाहरर म index सवतः 0 स
5 तक अगय तथा column क name
सवतः वाही अय जो dictionary म
keys थी |
2D Dictionary क keys column क
नाम हो गए
nprange(n) का
परयोग करक indexes
सवतः हनरशमत हो गयी |
A List या ndarrays की dictionary स DataFrame बनाना |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा indexes अपन
specify ककय ह |
ऄथाणत यकद अप index का sequence दत ह तो index अपक दवारा
कदया गया ही set होगा ऄनयथा वह सवतः 0 स n-1 तक का index
ललगा |
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की
dictionaries स हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
B Dictionaries की dictionary स DataFrame बनाना |
यहाा अप index और column
name दख कर समझ सकत ह
की कस assign हए
यकद यहाा yr2015 yr2016 और yr2017 क keys
ऄलग होत तो dataframe क rows और column
जयादा बढ़ जात और हबना match वाल row और
column म NaN store हो जाता |
2D ndarray स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
आसम column name और index सवतः ऄगय|
आसम column name user न कदए ह |
आसम column name तथा index दोनो
user न कदए ह |
Series Object की 2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की Series स
हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
DataFrame ऑबजकट को आस परकार भी
बनाया जा सकता ह |
दसर DataFrame ऑबजकट स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame ऑबजकट को दसर
DataFrame ऑबजकट स बनाया गया ह|
DataFrame ऑबजकट को display करना| DataFrame ऑबजकट
को display करन का
syntax य ह |
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
bull जब अप एक DataFrame ऑबजकट बनात ह तो आसस समबहधत समसत सिना जस
- size आसका datatype आतयाकद attributes क दवारा परापत ककय जा सकत ह |
ltDataFrame Objectgtltattribute namegt
bull कि attributes हनमन ह -
Attribute Description
index यह dataframe क index मतऱब (row lebels) को ददखता ह | columns यह dataframe क column lebels को ददखता ह | axes यह दोनो axes अथाात index और column को return करता ह | dtypes यह dataframe क अनदर रख डाटा का datatype return करता ह| size ऑबजकट म उपसथथत elements की सॊखया return करता ह | shape यह dataframe की dimention की tuple return करता ह | values यह dataframe का numpy रप return करता ह | empty यह एक सचक ह की dataframe empty ह या नह ॊ| ndim यह axesarray की dimention को return करता ह | T यह index और column को transpose कर दता ह|
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame स Selecting और Accessing
सॊजीव भदौररया क० वव० बाराबॊकी
bull Column को select करना
ltDataFrame Objectgt[ltcolumn namegt]
या ltDataFrame Objectgtltcolumn namegt
ltDataFrame Objectgt[column name की list ]
एक column को select करन क लऱए
कई column को select करन क लऱए
कई column म हम करम बदऱ सकत ह|
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgtloc [ltStartRowgt ltEndRowgt ltStartColgt ltEndColgt]
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgt iloc [ltRow Indexgt ltRowIndexgt ltColIndexgt ltColIndexgt]
DataFrame स Individual Value को select करना ltDFObjectgt ltcol name[row name or row index]
या
ltDFObjectgt at [ltrow namegtltcol namegt]
या
ltDFObjectgt iat[ltrow indexgt ltcol indexgt]
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
a) नए column को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltCol Namegt[ltrow labelgt]=ltnew valuegt
चॉकक इसम lsquoFourrsquo नाम स कोई column नह ॊ ह तो नया column add हो गया |
चॉकक इसम lsquoFourrsquo नाम स column ह तो column क मानो म बदऱाव हो गया |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
b) नए row को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgt at[ltRowNamegt ] =ltnew valuegt
या
ltDFObjectgt loc[ltRowNamegt ] =ltnew valuegt
चॉकक इसम lsquoDrsquo नाम स कोई row नह ॊ थी तो नयी row add हो गयी |
चॉकक इसम lsquoDrsquo नाम स row नह ॊ तो row की values change हो गयी |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
c) Single value को change करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltColNamegt[ltRowNameLebelgt]
इसम D वाऱ row म lsquoThreersquo वाऱ column म value बदऱ गयी |
Values को ऐस भी change ककया जा सकता ह | सजसम row या column क अऱग अऱग values भी ददए जा सकत ह |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
Column को delete करन क हलए हनमन syntax का परयोग कर |
del ltDFObjectgt[ltColNamegt] या
dfdrop([ltCol1NamegtltCol2Namegt ] axis=1)
axis =1 यह बताता ह की column को delete करना ह
del कमाॊड delete करन क बाद value return नह ॊ करता ह जबकक drop method delete करन क बाद तरॊत बची हई dataframe को return करता ह|
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
DataFrame bull Pandas का मखय object DataFrame होता ह | और यह pandas का सबस ऄहधक परयोग
ककया जान वाला Data Structure ह |
bull DataFrame एक Two -Dimensional Array होता ह जो ककसी भी data type को hold
कर सकती ह | और यह tabular format म data को store करता ह |
bull Finance Statistics Social Science और कइ engineering branch म आसका परयोग
ऄहधकता म ककया जाता ह |
bull DataFrame म data और आसका size दोनो ही mutable होत ह ऄथाणत आनह बदला जा
सकता ह |
bull DataFrame म दो हवहभनन indexes होत ह - row index और column index |
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame को बनाना और परदरशशत करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull 2 D फॉमट म डाटा को pass करक एक DataFrame object बनाया जा
सकता ह |
import pandas as pd ltdataFrameObjectgt = pdDataFrame(lta 2D Data Structuregt [columns=ltcolumn
sequencegt][index=ltindex sequencegt])
bull अप DataFrame को कइ तरीक स data values pass करक बना सकत ह
जस ndash
bull 2D dictionaries
bull 2D ndarrays
bull Series type object
bull Another DataFrame object
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदाहरर म index सवतः 0 स
5 तक अगय तथा column क name
सवतः वाही अय जो dictionary म
keys थी |
2D Dictionary क keys column क
नाम हो गए
nprange(n) का
परयोग करक indexes
सवतः हनरशमत हो गयी |
A List या ndarrays की dictionary स DataFrame बनाना |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा indexes अपन
specify ककय ह |
ऄथाणत यकद अप index का sequence दत ह तो index अपक दवारा
कदया गया ही set होगा ऄनयथा वह सवतः 0 स n-1 तक का index
ललगा |
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की
dictionaries स हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
B Dictionaries की dictionary स DataFrame बनाना |
यहाा अप index और column
name दख कर समझ सकत ह
की कस assign हए
यकद यहाा yr2015 yr2016 और yr2017 क keys
ऄलग होत तो dataframe क rows और column
जयादा बढ़ जात और हबना match वाल row और
column म NaN store हो जाता |
2D ndarray स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
आसम column name और index सवतः ऄगय|
आसम column name user न कदए ह |
आसम column name तथा index दोनो
user न कदए ह |
Series Object की 2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की Series स
हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
DataFrame ऑबजकट को आस परकार भी
बनाया जा सकता ह |
दसर DataFrame ऑबजकट स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame ऑबजकट को दसर
DataFrame ऑबजकट स बनाया गया ह|
DataFrame ऑबजकट को display करना| DataFrame ऑबजकट
को display करन का
syntax य ह |
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
bull जब अप एक DataFrame ऑबजकट बनात ह तो आसस समबहधत समसत सिना जस
- size आसका datatype आतयाकद attributes क दवारा परापत ककय जा सकत ह |
ltDataFrame Objectgtltattribute namegt
bull कि attributes हनमन ह -
Attribute Description
index यह dataframe क index मतऱब (row lebels) को ददखता ह | columns यह dataframe क column lebels को ददखता ह | axes यह दोनो axes अथाात index और column को return करता ह | dtypes यह dataframe क अनदर रख डाटा का datatype return करता ह| size ऑबजकट म उपसथथत elements की सॊखया return करता ह | shape यह dataframe की dimention की tuple return करता ह | values यह dataframe का numpy रप return करता ह | empty यह एक सचक ह की dataframe empty ह या नह ॊ| ndim यह axesarray की dimention को return करता ह | T यह index और column को transpose कर दता ह|
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame स Selecting और Accessing
सॊजीव भदौररया क० वव० बाराबॊकी
bull Column को select करना
ltDataFrame Objectgt[ltcolumn namegt]
या ltDataFrame Objectgtltcolumn namegt
ltDataFrame Objectgt[column name की list ]
एक column को select करन क लऱए
कई column को select करन क लऱए
कई column म हम करम बदऱ सकत ह|
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgtloc [ltStartRowgt ltEndRowgt ltStartColgt ltEndColgt]
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgt iloc [ltRow Indexgt ltRowIndexgt ltColIndexgt ltColIndexgt]
DataFrame स Individual Value को select करना ltDFObjectgt ltcol name[row name or row index]
या
ltDFObjectgt at [ltrow namegtltcol namegt]
या
ltDFObjectgt iat[ltrow indexgt ltcol indexgt]
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
a) नए column को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltCol Namegt[ltrow labelgt]=ltnew valuegt
चॉकक इसम lsquoFourrsquo नाम स कोई column नह ॊ ह तो नया column add हो गया |
चॉकक इसम lsquoFourrsquo नाम स column ह तो column क मानो म बदऱाव हो गया |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
b) नए row को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgt at[ltRowNamegt ] =ltnew valuegt
या
ltDFObjectgt loc[ltRowNamegt ] =ltnew valuegt
चॉकक इसम lsquoDrsquo नाम स कोई row नह ॊ थी तो नयी row add हो गयी |
चॉकक इसम lsquoDrsquo नाम स row नह ॊ तो row की values change हो गयी |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
c) Single value को change करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltColNamegt[ltRowNameLebelgt]
इसम D वाऱ row म lsquoThreersquo वाऱ column म value बदऱ गयी |
Values को ऐस भी change ककया जा सकता ह | सजसम row या column क अऱग अऱग values भी ददए जा सकत ह |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
Column को delete करन क हलए हनमन syntax का परयोग कर |
del ltDFObjectgt[ltColNamegt] या
dfdrop([ltCol1NamegtltCol2Namegt ] axis=1)
axis =1 यह बताता ह की column को delete करना ह
del कमाॊड delete करन क बाद value return नह ॊ करता ह जबकक drop method delete करन क बाद तरॊत बची हई dataframe को return करता ह|
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
DataFrame को बनाना और परदरशशत करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull 2 D फॉमट म डाटा को pass करक एक DataFrame object बनाया जा
सकता ह |
import pandas as pd ltdataFrameObjectgt = pdDataFrame(lta 2D Data Structuregt [columns=ltcolumn
sequencegt][index=ltindex sequencegt])
bull अप DataFrame को कइ तरीक स data values pass करक बना सकत ह
जस ndash
bull 2D dictionaries
bull 2D ndarrays
bull Series type object
bull Another DataFrame object
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदाहरर म index सवतः 0 स
5 तक अगय तथा column क name
सवतः वाही अय जो dictionary म
keys थी |
2D Dictionary क keys column क
नाम हो गए
nprange(n) का
परयोग करक indexes
सवतः हनरशमत हो गयी |
A List या ndarrays की dictionary स DataFrame बनाना |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा indexes अपन
specify ककय ह |
ऄथाणत यकद अप index का sequence दत ह तो index अपक दवारा
कदया गया ही set होगा ऄनयथा वह सवतः 0 स n-1 तक का index
ललगा |
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की
dictionaries स हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
B Dictionaries की dictionary स DataFrame बनाना |
यहाा अप index और column
name दख कर समझ सकत ह
की कस assign हए
यकद यहाा yr2015 yr2016 और yr2017 क keys
ऄलग होत तो dataframe क rows और column
जयादा बढ़ जात और हबना match वाल row और
column म NaN store हो जाता |
2D ndarray स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
आसम column name और index सवतः ऄगय|
आसम column name user न कदए ह |
आसम column name तथा index दोनो
user न कदए ह |
Series Object की 2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की Series स
हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
DataFrame ऑबजकट को आस परकार भी
बनाया जा सकता ह |
दसर DataFrame ऑबजकट स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame ऑबजकट को दसर
DataFrame ऑबजकट स बनाया गया ह|
DataFrame ऑबजकट को display करना| DataFrame ऑबजकट
को display करन का
syntax य ह |
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
bull जब अप एक DataFrame ऑबजकट बनात ह तो आसस समबहधत समसत सिना जस
- size आसका datatype आतयाकद attributes क दवारा परापत ककय जा सकत ह |
ltDataFrame Objectgtltattribute namegt
bull कि attributes हनमन ह -
Attribute Description
index यह dataframe क index मतऱब (row lebels) को ददखता ह | columns यह dataframe क column lebels को ददखता ह | axes यह दोनो axes अथाात index और column को return करता ह | dtypes यह dataframe क अनदर रख डाटा का datatype return करता ह| size ऑबजकट म उपसथथत elements की सॊखया return करता ह | shape यह dataframe की dimention की tuple return करता ह | values यह dataframe का numpy रप return करता ह | empty यह एक सचक ह की dataframe empty ह या नह ॊ| ndim यह axesarray की dimention को return करता ह | T यह index और column को transpose कर दता ह|
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame स Selecting और Accessing
सॊजीव भदौररया क० वव० बाराबॊकी
bull Column को select करना
ltDataFrame Objectgt[ltcolumn namegt]
या ltDataFrame Objectgtltcolumn namegt
ltDataFrame Objectgt[column name की list ]
एक column को select करन क लऱए
कई column को select करन क लऱए
कई column म हम करम बदऱ सकत ह|
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgtloc [ltStartRowgt ltEndRowgt ltStartColgt ltEndColgt]
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgt iloc [ltRow Indexgt ltRowIndexgt ltColIndexgt ltColIndexgt]
DataFrame स Individual Value को select करना ltDFObjectgt ltcol name[row name or row index]
या
ltDFObjectgt at [ltrow namegtltcol namegt]
या
ltDFObjectgt iat[ltrow indexgt ltcol indexgt]
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
a) नए column को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltCol Namegt[ltrow labelgt]=ltnew valuegt
चॉकक इसम lsquoFourrsquo नाम स कोई column नह ॊ ह तो नया column add हो गया |
चॉकक इसम lsquoFourrsquo नाम स column ह तो column क मानो म बदऱाव हो गया |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
b) नए row को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgt at[ltRowNamegt ] =ltnew valuegt
या
ltDFObjectgt loc[ltRowNamegt ] =ltnew valuegt
चॉकक इसम lsquoDrsquo नाम स कोई row नह ॊ थी तो नयी row add हो गयी |
चॉकक इसम lsquoDrsquo नाम स row नह ॊ तो row की values change हो गयी |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
c) Single value को change करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltColNamegt[ltRowNameLebelgt]
इसम D वाऱ row म lsquoThreersquo वाऱ column म value बदऱ गयी |
Values को ऐस भी change ककया जा सकता ह | सजसम row या column क अऱग अऱग values भी ददए जा सकत ह |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
Column को delete करन क हलए हनमन syntax का परयोग कर |
del ltDFObjectgt[ltColNamegt] या
dfdrop([ltCol1NamegtltCol2Namegt ] axis=1)
axis =1 यह बताता ह की column को delete करना ह
del कमाॊड delete करन क बाद value return नह ॊ करता ह जबकक drop method delete करन क बाद तरॊत बची हई dataframe को return करता ह|
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदाहरर म index सवतः 0 स
5 तक अगय तथा column क name
सवतः वाही अय जो dictionary म
keys थी |
2D Dictionary क keys column क
नाम हो गए
nprange(n) का
परयोग करक indexes
सवतः हनरशमत हो गयी |
A List या ndarrays की dictionary स DataFrame बनाना |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा indexes अपन
specify ककय ह |
ऄथाणत यकद अप index का sequence दत ह तो index अपक दवारा
कदया गया ही set होगा ऄनयथा वह सवतः 0 स n-1 तक का index
ललगा |
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की
dictionaries स हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
B Dictionaries की dictionary स DataFrame बनाना |
यहाा अप index और column
name दख कर समझ सकत ह
की कस assign हए
यकद यहाा yr2015 yr2016 और yr2017 क keys
ऄलग होत तो dataframe क rows और column
जयादा बढ़ जात और हबना match वाल row और
column म NaN store हो जाता |
2D ndarray स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
आसम column name और index सवतः ऄगय|
आसम column name user न कदए ह |
आसम column name तथा index दोनो
user न कदए ह |
Series Object की 2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की Series स
हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
DataFrame ऑबजकट को आस परकार भी
बनाया जा सकता ह |
दसर DataFrame ऑबजकट स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame ऑबजकट को दसर
DataFrame ऑबजकट स बनाया गया ह|
DataFrame ऑबजकट को display करना| DataFrame ऑबजकट
को display करन का
syntax य ह |
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
bull जब अप एक DataFrame ऑबजकट बनात ह तो आसस समबहधत समसत सिना जस
- size आसका datatype आतयाकद attributes क दवारा परापत ककय जा सकत ह |
ltDataFrame Objectgtltattribute namegt
bull कि attributes हनमन ह -
Attribute Description
index यह dataframe क index मतऱब (row lebels) को ददखता ह | columns यह dataframe क column lebels को ददखता ह | axes यह दोनो axes अथाात index और column को return करता ह | dtypes यह dataframe क अनदर रख डाटा का datatype return करता ह| size ऑबजकट म उपसथथत elements की सॊखया return करता ह | shape यह dataframe की dimention की tuple return करता ह | values यह dataframe का numpy रप return करता ह | empty यह एक सचक ह की dataframe empty ह या नह ॊ| ndim यह axesarray की dimention को return करता ह | T यह index और column को transpose कर दता ह|
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame स Selecting और Accessing
सॊजीव भदौररया क० वव० बाराबॊकी
bull Column को select करना
ltDataFrame Objectgt[ltcolumn namegt]
या ltDataFrame Objectgtltcolumn namegt
ltDataFrame Objectgt[column name की list ]
एक column को select करन क लऱए
कई column को select करन क लऱए
कई column म हम करम बदऱ सकत ह|
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgtloc [ltStartRowgt ltEndRowgt ltStartColgt ltEndColgt]
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgt iloc [ltRow Indexgt ltRowIndexgt ltColIndexgt ltColIndexgt]
DataFrame स Individual Value को select करना ltDFObjectgt ltcol name[row name or row index]
या
ltDFObjectgt at [ltrow namegtltcol namegt]
या
ltDFObjectgt iat[ltrow indexgt ltcol indexgt]
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
a) नए column को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltCol Namegt[ltrow labelgt]=ltnew valuegt
चॉकक इसम lsquoFourrsquo नाम स कोई column नह ॊ ह तो नया column add हो गया |
चॉकक इसम lsquoFourrsquo नाम स column ह तो column क मानो म बदऱाव हो गया |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
b) नए row को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgt at[ltRowNamegt ] =ltnew valuegt
या
ltDFObjectgt loc[ltRowNamegt ] =ltnew valuegt
चॉकक इसम lsquoDrsquo नाम स कोई row नह ॊ थी तो नयी row add हो गयी |
चॉकक इसम lsquoDrsquo नाम स row नह ॊ तो row की values change हो गयी |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
c) Single value को change करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltColNamegt[ltRowNameLebelgt]
इसम D वाऱ row म lsquoThreersquo वाऱ column म value बदऱ गयी |
Values को ऐस भी change ककया जा सकता ह | सजसम row या column क अऱग अऱग values भी ददए जा सकत ह |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
Column को delete करन क हलए हनमन syntax का परयोग कर |
del ltDFObjectgt[ltColNamegt] या
dfdrop([ltCol1NamegtltCol2Namegt ] axis=1)
axis =1 यह बताता ह की column को delete करना ह
del कमाॊड delete करन क बाद value return नह ॊ करता ह जबकक drop method delete करन क बाद तरॊत बची हई dataframe को return करता ह|
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा indexes अपन
specify ककय ह |
ऄथाणत यकद अप index का sequence दत ह तो index अपक दवारा
कदया गया ही set होगा ऄनयथा वह सवतः 0 स n-1 तक का index
ललगा |
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की
dictionaries स हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
B Dictionaries की dictionary स DataFrame बनाना |
यहाा अप index और column
name दख कर समझ सकत ह
की कस assign हए
यकद यहाा yr2015 yr2016 और yr2017 क keys
ऄलग होत तो dataframe क rows और column
जयादा बढ़ जात और हबना match वाल row और
column म NaN store हो जाता |
2D ndarray स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
आसम column name और index सवतः ऄगय|
आसम column name user न कदए ह |
आसम column name तथा index दोनो
user न कदए ह |
Series Object की 2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की Series स
हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
DataFrame ऑबजकट को आस परकार भी
बनाया जा सकता ह |
दसर DataFrame ऑबजकट स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame ऑबजकट को दसर
DataFrame ऑबजकट स बनाया गया ह|
DataFrame ऑबजकट को display करना| DataFrame ऑबजकट
को display करन का
syntax य ह |
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
bull जब अप एक DataFrame ऑबजकट बनात ह तो आसस समबहधत समसत सिना जस
- size आसका datatype आतयाकद attributes क दवारा परापत ककय जा सकत ह |
ltDataFrame Objectgtltattribute namegt
bull कि attributes हनमन ह -
Attribute Description
index यह dataframe क index मतऱब (row lebels) को ददखता ह | columns यह dataframe क column lebels को ददखता ह | axes यह दोनो axes अथाात index और column को return करता ह | dtypes यह dataframe क अनदर रख डाटा का datatype return करता ह| size ऑबजकट म उपसथथत elements की सॊखया return करता ह | shape यह dataframe की dimention की tuple return करता ह | values यह dataframe का numpy रप return करता ह | empty यह एक सचक ह की dataframe empty ह या नह ॊ| ndim यह axesarray की dimention को return करता ह | T यह index और column को transpose कर दता ह|
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame स Selecting और Accessing
सॊजीव भदौररया क० वव० बाराबॊकी
bull Column को select करना
ltDataFrame Objectgt[ltcolumn namegt]
या ltDataFrame Objectgtltcolumn namegt
ltDataFrame Objectgt[column name की list ]
एक column को select करन क लऱए
कई column को select करन क लऱए
कई column म हम करम बदऱ सकत ह|
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgtloc [ltStartRowgt ltEndRowgt ltStartColgt ltEndColgt]
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgt iloc [ltRow Indexgt ltRowIndexgt ltColIndexgt ltColIndexgt]
DataFrame स Individual Value को select करना ltDFObjectgt ltcol name[row name or row index]
या
ltDFObjectgt at [ltrow namegtltcol namegt]
या
ltDFObjectgt iat[ltrow indexgt ltcol indexgt]
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
a) नए column को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltCol Namegt[ltrow labelgt]=ltnew valuegt
चॉकक इसम lsquoFourrsquo नाम स कोई column नह ॊ ह तो नया column add हो गया |
चॉकक इसम lsquoFourrsquo नाम स column ह तो column क मानो म बदऱाव हो गया |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
b) नए row को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgt at[ltRowNamegt ] =ltnew valuegt
या
ltDFObjectgt loc[ltRowNamegt ] =ltnew valuegt
चॉकक इसम lsquoDrsquo नाम स कोई row नह ॊ थी तो नयी row add हो गयी |
चॉकक इसम lsquoDrsquo नाम स row नह ॊ तो row की values change हो गयी |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
c) Single value को change करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltColNamegt[ltRowNameLebelgt]
इसम D वाऱ row म lsquoThreersquo वाऱ column म value बदऱ गयी |
Values को ऐस भी change ककया जा सकता ह | सजसम row या column क अऱग अऱग values भी ददए जा सकत ह |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
Column को delete करन क हलए हनमन syntax का परयोग कर |
del ltDFObjectgt[ltColNamegt] या
dfdrop([ltCol1NamegtltCol2Namegt ] axis=1)
axis =1 यह बताता ह की column को delete करना ह
del कमाॊड delete करन क बाद value return नह ॊ करता ह जबकक drop method delete करन क बाद तरॊत बची हई dataframe को return करता ह|
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की
dictionaries स हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
B Dictionaries की dictionary स DataFrame बनाना |
यहाा अप index और column
name दख कर समझ सकत ह
की कस assign हए
यकद यहाा yr2015 yr2016 और yr2017 क keys
ऄलग होत तो dataframe क rows और column
जयादा बढ़ जात और हबना match वाल row और
column म NaN store हो जाता |
2D ndarray स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
आसम column name और index सवतः ऄगय|
आसम column name user न कदए ह |
आसम column name तथा index दोनो
user न कदए ह |
Series Object की 2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की Series स
हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
DataFrame ऑबजकट को आस परकार भी
बनाया जा सकता ह |
दसर DataFrame ऑबजकट स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame ऑबजकट को दसर
DataFrame ऑबजकट स बनाया गया ह|
DataFrame ऑबजकट को display करना| DataFrame ऑबजकट
को display करन का
syntax य ह |
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
bull जब अप एक DataFrame ऑबजकट बनात ह तो आसस समबहधत समसत सिना जस
- size आसका datatype आतयाकद attributes क दवारा परापत ककय जा सकत ह |
ltDataFrame Objectgtltattribute namegt
bull कि attributes हनमन ह -
Attribute Description
index यह dataframe क index मतऱब (row lebels) को ददखता ह | columns यह dataframe क column lebels को ददखता ह | axes यह दोनो axes अथाात index और column को return करता ह | dtypes यह dataframe क अनदर रख डाटा का datatype return करता ह| size ऑबजकट म उपसथथत elements की सॊखया return करता ह | shape यह dataframe की dimention की tuple return करता ह | values यह dataframe का numpy रप return करता ह | empty यह एक सचक ह की dataframe empty ह या नह ॊ| ndim यह axesarray की dimention को return करता ह | T यह index और column को transpose कर दता ह|
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame स Selecting और Accessing
सॊजीव भदौररया क० वव० बाराबॊकी
bull Column को select करना
ltDataFrame Objectgt[ltcolumn namegt]
या ltDataFrame Objectgtltcolumn namegt
ltDataFrame Objectgt[column name की list ]
एक column को select करन क लऱए
कई column को select करन क लऱए
कई column म हम करम बदऱ सकत ह|
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgtloc [ltStartRowgt ltEndRowgt ltStartColgt ltEndColgt]
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgt iloc [ltRow Indexgt ltRowIndexgt ltColIndexgt ltColIndexgt]
DataFrame स Individual Value को select करना ltDFObjectgt ltcol name[row name or row index]
या
ltDFObjectgt at [ltrow namegtltcol namegt]
या
ltDFObjectgt iat[ltrow indexgt ltcol indexgt]
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
a) नए column को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltCol Namegt[ltrow labelgt]=ltnew valuegt
चॉकक इसम lsquoFourrsquo नाम स कोई column नह ॊ ह तो नया column add हो गया |
चॉकक इसम lsquoFourrsquo नाम स column ह तो column क मानो म बदऱाव हो गया |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
b) नए row को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgt at[ltRowNamegt ] =ltnew valuegt
या
ltDFObjectgt loc[ltRowNamegt ] =ltnew valuegt
चॉकक इसम lsquoDrsquo नाम स कोई row नह ॊ थी तो नयी row add हो गयी |
चॉकक इसम lsquoDrsquo नाम स row नह ॊ तो row की values change हो गयी |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
c) Single value को change करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltColNamegt[ltRowNameLebelgt]
इसम D वाऱ row म lsquoThreersquo वाऱ column म value बदऱ गयी |
Values को ऐस भी change ककया जा सकता ह | सजसम row या column क अऱग अऱग values भी ददए जा सकत ह |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
Column को delete करन क हलए हनमन syntax का परयोग कर |
del ltDFObjectgt[ltColNamegt] या
dfdrop([ltCol1NamegtltCol2Namegt ] axis=1)
axis =1 यह बताता ह की column को delete करना ह
del कमाॊड delete करन क बाद value return नह ॊ करता ह जबकक drop method delete करन क बाद तरॊत बची हई dataframe को return करता ह|
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
2D ndarray स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
आसम column name और index सवतः ऄगय|
आसम column name user न कदए ह |
आसम column name तथा index दोनो
user न कदए ह |
Series Object की 2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की Series स
हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
DataFrame ऑबजकट को आस परकार भी
बनाया जा सकता ह |
दसर DataFrame ऑबजकट स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame ऑबजकट को दसर
DataFrame ऑबजकट स बनाया गया ह|
DataFrame ऑबजकट को display करना| DataFrame ऑबजकट
को display करन का
syntax य ह |
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
bull जब अप एक DataFrame ऑबजकट बनात ह तो आसस समबहधत समसत सिना जस
- size आसका datatype आतयाकद attributes क दवारा परापत ककय जा सकत ह |
ltDataFrame Objectgtltattribute namegt
bull कि attributes हनमन ह -
Attribute Description
index यह dataframe क index मतऱब (row lebels) को ददखता ह | columns यह dataframe क column lebels को ददखता ह | axes यह दोनो axes अथाात index और column को return करता ह | dtypes यह dataframe क अनदर रख डाटा का datatype return करता ह| size ऑबजकट म उपसथथत elements की सॊखया return करता ह | shape यह dataframe की dimention की tuple return करता ह | values यह dataframe का numpy रप return करता ह | empty यह एक सचक ह की dataframe empty ह या नह ॊ| ndim यह axesarray की dimention को return करता ह | T यह index और column को transpose कर दता ह|
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame स Selecting और Accessing
सॊजीव भदौररया क० वव० बाराबॊकी
bull Column को select करना
ltDataFrame Objectgt[ltcolumn namegt]
या ltDataFrame Objectgtltcolumn namegt
ltDataFrame Objectgt[column name की list ]
एक column को select करन क लऱए
कई column को select करन क लऱए
कई column म हम करम बदऱ सकत ह|
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgtloc [ltStartRowgt ltEndRowgt ltStartColgt ltEndColgt]
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgt iloc [ltRow Indexgt ltRowIndexgt ltColIndexgt ltColIndexgt]
DataFrame स Individual Value को select करना ltDFObjectgt ltcol name[row name or row index]
या
ltDFObjectgt at [ltrow namegtltcol namegt]
या
ltDFObjectgt iat[ltrow indexgt ltcol indexgt]
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
a) नए column को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltCol Namegt[ltrow labelgt]=ltnew valuegt
चॉकक इसम lsquoFourrsquo नाम स कोई column नह ॊ ह तो नया column add हो गया |
चॉकक इसम lsquoFourrsquo नाम स column ह तो column क मानो म बदऱाव हो गया |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
b) नए row को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgt at[ltRowNamegt ] =ltnew valuegt
या
ltDFObjectgt loc[ltRowNamegt ] =ltnew valuegt
चॉकक इसम lsquoDrsquo नाम स कोई row नह ॊ थी तो नयी row add हो गयी |
चॉकक इसम lsquoDrsquo नाम स row नह ॊ तो row की values change हो गयी |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
c) Single value को change करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltColNamegt[ltRowNameLebelgt]
इसम D वाऱ row म lsquoThreersquo वाऱ column म value बदऱ गयी |
Values को ऐस भी change ककया जा सकता ह | सजसम row या column क अऱग अऱग values भी ददए जा सकत ह |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
Column को delete करन क हलए हनमन syntax का परयोग कर |
del ltDFObjectgt[ltColNamegt] या
dfdrop([ltCol1NamegtltCol2Namegt ] axis=1)
axis =1 यह बताता ह की column को delete करना ह
del कमाॊड delete करन क बाद value return नह ॊ करता ह जबकक drop method delete करन क बाद तरॊत बची हई dataframe को return करता ह|
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Series Object की 2D Dictionary स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
यह 2D Dictionary ह जो उपर की Series स
हमलकर बनी ह |
DataFrame ऑबजकट create हो गया |
DataFrame ऑबजकट को आस परकार भी
बनाया जा सकता ह |
दसर DataFrame ऑबजकट स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame ऑबजकट को दसर
DataFrame ऑबजकट स बनाया गया ह|
DataFrame ऑबजकट को display करना| DataFrame ऑबजकट
को display करन का
syntax य ह |
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
bull जब अप एक DataFrame ऑबजकट बनात ह तो आसस समबहधत समसत सिना जस
- size आसका datatype आतयाकद attributes क दवारा परापत ककय जा सकत ह |
ltDataFrame Objectgtltattribute namegt
bull कि attributes हनमन ह -
Attribute Description
index यह dataframe क index मतऱब (row lebels) को ददखता ह | columns यह dataframe क column lebels को ददखता ह | axes यह दोनो axes अथाात index और column को return करता ह | dtypes यह dataframe क अनदर रख डाटा का datatype return करता ह| size ऑबजकट म उपसथथत elements की सॊखया return करता ह | shape यह dataframe की dimention की tuple return करता ह | values यह dataframe का numpy रप return करता ह | empty यह एक सचक ह की dataframe empty ह या नह ॊ| ndim यह axesarray की dimention को return करता ह | T यह index और column को transpose कर दता ह|
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame स Selecting और Accessing
सॊजीव भदौररया क० वव० बाराबॊकी
bull Column को select करना
ltDataFrame Objectgt[ltcolumn namegt]
या ltDataFrame Objectgtltcolumn namegt
ltDataFrame Objectgt[column name की list ]
एक column को select करन क लऱए
कई column को select करन क लऱए
कई column म हम करम बदऱ सकत ह|
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgtloc [ltStartRowgt ltEndRowgt ltStartColgt ltEndColgt]
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgt iloc [ltRow Indexgt ltRowIndexgt ltColIndexgt ltColIndexgt]
DataFrame स Individual Value को select करना ltDFObjectgt ltcol name[row name or row index]
या
ltDFObjectgt at [ltrow namegtltcol namegt]
या
ltDFObjectgt iat[ltrow indexgt ltcol indexgt]
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
a) नए column को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltCol Namegt[ltrow labelgt]=ltnew valuegt
चॉकक इसम lsquoFourrsquo नाम स कोई column नह ॊ ह तो नया column add हो गया |
चॉकक इसम lsquoFourrsquo नाम स column ह तो column क मानो म बदऱाव हो गया |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
b) नए row को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgt at[ltRowNamegt ] =ltnew valuegt
या
ltDFObjectgt loc[ltRowNamegt ] =ltnew valuegt
चॉकक इसम lsquoDrsquo नाम स कोई row नह ॊ थी तो नयी row add हो गयी |
चॉकक इसम lsquoDrsquo नाम स row नह ॊ तो row की values change हो गयी |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
c) Single value को change करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltColNamegt[ltRowNameLebelgt]
इसम D वाऱ row म lsquoThreersquo वाऱ column म value बदऱ गयी |
Values को ऐस भी change ककया जा सकता ह | सजसम row या column क अऱग अऱग values भी ददए जा सकत ह |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
Column को delete करन क हलए हनमन syntax का परयोग कर |
del ltDFObjectgt[ltColNamegt] या
dfdrop([ltCol1NamegtltCol2Namegt ] axis=1)
axis =1 यह बताता ह की column को delete करना ह
del कमाॊड delete करन क बाद value return नह ॊ करता ह जबकक drop method delete करन क बाद तरॊत बची हई dataframe को return करता ह|
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
दसर DataFrame ऑबजकट स DataFrame बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame ऑबजकट को दसर
DataFrame ऑबजकट स बनाया गया ह|
DataFrame ऑबजकट को display करना| DataFrame ऑबजकट
को display करन का
syntax य ह |
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
bull जब अप एक DataFrame ऑबजकट बनात ह तो आसस समबहधत समसत सिना जस
- size आसका datatype आतयाकद attributes क दवारा परापत ककय जा सकत ह |
ltDataFrame Objectgtltattribute namegt
bull कि attributes हनमन ह -
Attribute Description
index यह dataframe क index मतऱब (row lebels) को ददखता ह | columns यह dataframe क column lebels को ददखता ह | axes यह दोनो axes अथाात index और column को return करता ह | dtypes यह dataframe क अनदर रख डाटा का datatype return करता ह| size ऑबजकट म उपसथथत elements की सॊखया return करता ह | shape यह dataframe की dimention की tuple return करता ह | values यह dataframe का numpy रप return करता ह | empty यह एक सचक ह की dataframe empty ह या नह ॊ| ndim यह axesarray की dimention को return करता ह | T यह index और column को transpose कर दता ह|
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame स Selecting और Accessing
सॊजीव भदौररया क० वव० बाराबॊकी
bull Column को select करना
ltDataFrame Objectgt[ltcolumn namegt]
या ltDataFrame Objectgtltcolumn namegt
ltDataFrame Objectgt[column name की list ]
एक column को select करन क लऱए
कई column को select करन क लऱए
कई column म हम करम बदऱ सकत ह|
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgtloc [ltStartRowgt ltEndRowgt ltStartColgt ltEndColgt]
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgt iloc [ltRow Indexgt ltRowIndexgt ltColIndexgt ltColIndexgt]
DataFrame स Individual Value को select करना ltDFObjectgt ltcol name[row name or row index]
या
ltDFObjectgt at [ltrow namegtltcol namegt]
या
ltDFObjectgt iat[ltrow indexgt ltcol indexgt]
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
a) नए column को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltCol Namegt[ltrow labelgt]=ltnew valuegt
चॉकक इसम lsquoFourrsquo नाम स कोई column नह ॊ ह तो नया column add हो गया |
चॉकक इसम lsquoFourrsquo नाम स column ह तो column क मानो म बदऱाव हो गया |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
b) नए row को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgt at[ltRowNamegt ] =ltnew valuegt
या
ltDFObjectgt loc[ltRowNamegt ] =ltnew valuegt
चॉकक इसम lsquoDrsquo नाम स कोई row नह ॊ थी तो नयी row add हो गयी |
चॉकक इसम lsquoDrsquo नाम स row नह ॊ तो row की values change हो गयी |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
c) Single value को change करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltColNamegt[ltRowNameLebelgt]
इसम D वाऱ row म lsquoThreersquo वाऱ column म value बदऱ गयी |
Values को ऐस भी change ककया जा सकता ह | सजसम row या column क अऱग अऱग values भी ददए जा सकत ह |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
Column को delete करन क हलए हनमन syntax का परयोग कर |
del ltDFObjectgt[ltColNamegt] या
dfdrop([ltCol1NamegtltCol2Namegt ] axis=1)
axis =1 यह बताता ह की column को delete करना ह
del कमाॊड delete करन क बाद value return नह ॊ करता ह जबकक drop method delete करन क बाद तरॊत बची हई dataframe को return करता ह|
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
bull जब अप एक DataFrame ऑबजकट बनात ह तो आसस समबहधत समसत सिना जस
- size आसका datatype आतयाकद attributes क दवारा परापत ककय जा सकत ह |
ltDataFrame Objectgtltattribute namegt
bull कि attributes हनमन ह -
Attribute Description
index यह dataframe क index मतऱब (row lebels) को ददखता ह | columns यह dataframe क column lebels को ददखता ह | axes यह दोनो axes अथाात index और column को return करता ह | dtypes यह dataframe क अनदर रख डाटा का datatype return करता ह| size ऑबजकट म उपसथथत elements की सॊखया return करता ह | shape यह dataframe की dimention की tuple return करता ह | values यह dataframe का numpy रप return करता ह | empty यह एक सचक ह की dataframe empty ह या नह ॊ| ndim यह axesarray की dimention को return करता ह | T यह index और column को transpose कर दता ह|
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame स Selecting और Accessing
सॊजीव भदौररया क० वव० बाराबॊकी
bull Column को select करना
ltDataFrame Objectgt[ltcolumn namegt]
या ltDataFrame Objectgtltcolumn namegt
ltDataFrame Objectgt[column name की list ]
एक column को select करन क लऱए
कई column को select करन क लऱए
कई column म हम करम बदऱ सकत ह|
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgtloc [ltStartRowgt ltEndRowgt ltStartColgt ltEndColgt]
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgt iloc [ltRow Indexgt ltRowIndexgt ltColIndexgt ltColIndexgt]
DataFrame स Individual Value को select करना ltDFObjectgt ltcol name[row name or row index]
या
ltDFObjectgt at [ltrow namegtltcol namegt]
या
ltDFObjectgt iat[ltrow indexgt ltcol indexgt]
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
a) नए column को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltCol Namegt[ltrow labelgt]=ltnew valuegt
चॉकक इसम lsquoFourrsquo नाम स कोई column नह ॊ ह तो नया column add हो गया |
चॉकक इसम lsquoFourrsquo नाम स column ह तो column क मानो म बदऱाव हो गया |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
b) नए row को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgt at[ltRowNamegt ] =ltnew valuegt
या
ltDFObjectgt loc[ltRowNamegt ] =ltnew valuegt
चॉकक इसम lsquoDrsquo नाम स कोई row नह ॊ थी तो नयी row add हो गयी |
चॉकक इसम lsquoDrsquo नाम स row नह ॊ तो row की values change हो गयी |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
c) Single value को change करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltColNamegt[ltRowNameLebelgt]
इसम D वाऱ row म lsquoThreersquo वाऱ column म value बदऱ गयी |
Values को ऐस भी change ककया जा सकता ह | सजसम row या column क अऱग अऱग values भी ददए जा सकत ह |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
Column को delete करन क हलए हनमन syntax का परयोग कर |
del ltDFObjectgt[ltColNamegt] या
dfdrop([ltCol1NamegtltCol2Namegt ] axis=1)
axis =1 यह बताता ह की column को delete करना ह
del कमाॊड delete करन क बाद value return नह ॊ करता ह जबकक drop method delete करन क बाद तरॊत बची हई dataframe को return करता ह|
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
DataFrame Attributes
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame स Selecting और Accessing
सॊजीव भदौररया क० वव० बाराबॊकी
bull Column को select करना
ltDataFrame Objectgt[ltcolumn namegt]
या ltDataFrame Objectgtltcolumn namegt
ltDataFrame Objectgt[column name की list ]
एक column को select करन क लऱए
कई column को select करन क लऱए
कई column म हम करम बदऱ सकत ह|
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgtloc [ltStartRowgt ltEndRowgt ltStartColgt ltEndColgt]
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgt iloc [ltRow Indexgt ltRowIndexgt ltColIndexgt ltColIndexgt]
DataFrame स Individual Value को select करना ltDFObjectgt ltcol name[row name or row index]
या
ltDFObjectgt at [ltrow namegtltcol namegt]
या
ltDFObjectgt iat[ltrow indexgt ltcol indexgt]
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
a) नए column को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltCol Namegt[ltrow labelgt]=ltnew valuegt
चॉकक इसम lsquoFourrsquo नाम स कोई column नह ॊ ह तो नया column add हो गया |
चॉकक इसम lsquoFourrsquo नाम स column ह तो column क मानो म बदऱाव हो गया |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
b) नए row को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgt at[ltRowNamegt ] =ltnew valuegt
या
ltDFObjectgt loc[ltRowNamegt ] =ltnew valuegt
चॉकक इसम lsquoDrsquo नाम स कोई row नह ॊ थी तो नयी row add हो गयी |
चॉकक इसम lsquoDrsquo नाम स row नह ॊ तो row की values change हो गयी |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
c) Single value को change करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltColNamegt[ltRowNameLebelgt]
इसम D वाऱ row म lsquoThreersquo वाऱ column म value बदऱ गयी |
Values को ऐस भी change ककया जा सकता ह | सजसम row या column क अऱग अऱग values भी ददए जा सकत ह |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
Column को delete करन क हलए हनमन syntax का परयोग कर |
del ltDFObjectgt[ltColNamegt] या
dfdrop([ltCol1NamegtltCol2Namegt ] axis=1)
axis =1 यह बताता ह की column को delete करना ह
del कमाॊड delete करन क बाद value return नह ॊ करता ह जबकक drop method delete करन क बाद तरॊत बची हई dataframe को return करता ह|
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
DataFrame स Selecting और Accessing
सॊजीव भदौररया क० वव० बाराबॊकी
bull Column को select करना
ltDataFrame Objectgt[ltcolumn namegt]
या ltDataFrame Objectgtltcolumn namegt
ltDataFrame Objectgt[column name की list ]
एक column को select करन क लऱए
कई column को select करन क लऱए
कई column म हम करम बदऱ सकत ह|
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgtloc [ltStartRowgt ltEndRowgt ltStartColgt ltEndColgt]
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgt iloc [ltRow Indexgt ltRowIndexgt ltColIndexgt ltColIndexgt]
DataFrame स Individual Value को select करना ltDFObjectgt ltcol name[row name or row index]
या
ltDFObjectgt at [ltrow namegtltcol namegt]
या
ltDFObjectgt iat[ltrow indexgt ltcol indexgt]
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
a) नए column को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltCol Namegt[ltrow labelgt]=ltnew valuegt
चॉकक इसम lsquoFourrsquo नाम स कोई column नह ॊ ह तो नया column add हो गया |
चॉकक इसम lsquoFourrsquo नाम स column ह तो column क मानो म बदऱाव हो गया |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
b) नए row को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgt at[ltRowNamegt ] =ltnew valuegt
या
ltDFObjectgt loc[ltRowNamegt ] =ltnew valuegt
चॉकक इसम lsquoDrsquo नाम स कोई row नह ॊ थी तो नयी row add हो गयी |
चॉकक इसम lsquoDrsquo नाम स row नह ॊ तो row की values change हो गयी |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
c) Single value को change करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltColNamegt[ltRowNameLebelgt]
इसम D वाऱ row म lsquoThreersquo वाऱ column म value बदऱ गयी |
Values को ऐस भी change ककया जा सकता ह | सजसम row या column क अऱग अऱग values भी ददए जा सकत ह |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
Column को delete करन क हलए हनमन syntax का परयोग कर |
del ltDFObjectgt[ltColNamegt] या
dfdrop([ltCol1NamegtltCol2Namegt ] axis=1)
axis =1 यह बताता ह की column को delete करना ह
del कमाॊड delete करन क बाद value return नह ॊ करता ह जबकक drop method delete करन क बाद तरॊत बची हई dataframe को return करता ह|
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgtloc [ltStartRowgt ltEndRowgt ltStartColgt ltEndColgt]
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgt iloc [ltRow Indexgt ltRowIndexgt ltColIndexgt ltColIndexgt]
DataFrame स Individual Value को select करना ltDFObjectgt ltcol name[row name or row index]
या
ltDFObjectgt at [ltrow namegtltcol namegt]
या
ltDFObjectgt iat[ltrow indexgt ltcol indexgt]
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
a) नए column को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltCol Namegt[ltrow labelgt]=ltnew valuegt
चॉकक इसम lsquoFourrsquo नाम स कोई column नह ॊ ह तो नया column add हो गया |
चॉकक इसम lsquoFourrsquo नाम स column ह तो column क मानो म बदऱाव हो गया |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
b) नए row को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgt at[ltRowNamegt ] =ltnew valuegt
या
ltDFObjectgt loc[ltRowNamegt ] =ltnew valuegt
चॉकक इसम lsquoDrsquo नाम स कोई row नह ॊ थी तो नयी row add हो गयी |
चॉकक इसम lsquoDrsquo नाम स row नह ॊ तो row की values change हो गयी |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
c) Single value को change करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltColNamegt[ltRowNameLebelgt]
इसम D वाऱ row म lsquoThreersquo वाऱ column म value बदऱ गयी |
Values को ऐस भी change ककया जा सकता ह | सजसम row या column क अऱग अऱग values भी ददए जा सकत ह |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
Column को delete करन क हलए हनमन syntax का परयोग कर |
del ltDFObjectgt[ltColNamegt] या
dfdrop([ltCol1NamegtltCol2Namegt ] axis=1)
axis =1 यह बताता ह की column को delete करना ह
del कमाॊड delete करन क बाद value return नह ॊ करता ह जबकक drop method delete करन क बाद तरॊत बची हई dataframe को return करता ह|
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
DataFrame स subset को select करना
सॊजीव भदौररया क० वव० बाराबॊकी
ltDataFrameObjectgt iloc [ltRow Indexgt ltRowIndexgt ltColIndexgt ltColIndexgt]
DataFrame स Individual Value को select करना ltDFObjectgt ltcol name[row name or row index]
या
ltDFObjectgt at [ltrow namegtltcol namegt]
या
ltDFObjectgt iat[ltrow indexgt ltcol indexgt]
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
a) नए column को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltCol Namegt[ltrow labelgt]=ltnew valuegt
चॉकक इसम lsquoFourrsquo नाम स कोई column नह ॊ ह तो नया column add हो गया |
चॉकक इसम lsquoFourrsquo नाम स column ह तो column क मानो म बदऱाव हो गया |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
b) नए row को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgt at[ltRowNamegt ] =ltnew valuegt
या
ltDFObjectgt loc[ltRowNamegt ] =ltnew valuegt
चॉकक इसम lsquoDrsquo नाम स कोई row नह ॊ थी तो नयी row add हो गयी |
चॉकक इसम lsquoDrsquo नाम स row नह ॊ तो row की values change हो गयी |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
c) Single value को change करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltColNamegt[ltRowNameLebelgt]
इसम D वाऱ row म lsquoThreersquo वाऱ column म value बदऱ गयी |
Values को ऐस भी change ककया जा सकता ह | सजसम row या column क अऱग अऱग values भी ददए जा सकत ह |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
Column को delete करन क हलए हनमन syntax का परयोग कर |
del ltDFObjectgt[ltColNamegt] या
dfdrop([ltCol1NamegtltCol2Namegt ] axis=1)
axis =1 यह बताता ह की column को delete करना ह
del कमाॊड delete करन क बाद value return नह ॊ करता ह जबकक drop method delete करन क बाद तरॊत बची हई dataframe को return करता ह|
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
a) नए column को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltCol Namegt[ltrow labelgt]=ltnew valuegt
चॉकक इसम lsquoFourrsquo नाम स कोई column नह ॊ ह तो नया column add हो गया |
चॉकक इसम lsquoFourrsquo नाम स column ह तो column क मानो म बदऱाव हो गया |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
b) नए row को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgt at[ltRowNamegt ] =ltnew valuegt
या
ltDFObjectgt loc[ltRowNamegt ] =ltnew valuegt
चॉकक इसम lsquoDrsquo नाम स कोई row नह ॊ थी तो नयी row add हो गयी |
चॉकक इसम lsquoDrsquo नाम स row नह ॊ तो row की values change हो गयी |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
c) Single value को change करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltColNamegt[ltRowNameLebelgt]
इसम D वाऱ row म lsquoThreersquo वाऱ column म value बदऱ गयी |
Values को ऐस भी change ककया जा सकता ह | सजसम row या column क अऱग अऱग values भी ददए जा सकत ह |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
Column को delete करन क हलए हनमन syntax का परयोग कर |
del ltDFObjectgt[ltColNamegt] या
dfdrop([ltCol1NamegtltCol2Namegt ] axis=1)
axis =1 यह बताता ह की column को delete करना ह
del कमाॊड delete करन क बाद value return नह ॊ करता ह जबकक drop method delete करन क बाद तरॊत बची हई dataframe को return करता ह|
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
b) नए row को change या add करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgt at[ltRowNamegt ] =ltnew valuegt
या
ltDFObjectgt loc[ltRowNamegt ] =ltnew valuegt
चॉकक इसम lsquoDrsquo नाम स कोई row नह ॊ थी तो नयी row add हो गयी |
चॉकक इसम lsquoDrsquo नाम स row नह ॊ तो row की values change हो गयी |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
c) Single value को change करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltColNamegt[ltRowNameLebelgt]
इसम D वाऱ row म lsquoThreersquo वाऱ column म value बदऱ गयी |
Values को ऐस भी change ककया जा सकता ह | सजसम row या column क अऱग अऱग values भी ददए जा सकत ह |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
Column को delete करन क हलए हनमन syntax का परयोग कर |
del ltDFObjectgt[ltColNamegt] या
dfdrop([ltCol1NamegtltCol2Namegt ] axis=1)
axis =1 यह बताता ह की column को delete करना ह
del कमाॊड delete करन क बाद value return नह ॊ करता ह जबकक drop method delete करन क बाद तरॊत बची हई dataframe को return करता ह|
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
c) Single value को change करन क हलए हनमन syntax का परयोग कर |
ltDFObjectgtltColNamegt[ltRowNameLebelgt]
इसम D वाऱ row म lsquoThreersquo वाऱ column म value बदऱ गयी |
Values को ऐस भी change ककया जा सकता ह | सजसम row या column क अऱग अऱग values भी ददए जा सकत ह |
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
Column को delete करन क हलए हनमन syntax का परयोग कर |
del ltDFObjectgt[ltColNamegt] या
dfdrop([ltCol1NamegtltCol2Namegt ] axis=1)
axis =1 यह बताता ह की column को delete करना ह
del कमाॊड delete करन क बाद value return नह ॊ करता ह जबकक drop method delete करन क बाद तरॊत बची हई dataframe को return करता ह|
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
DataFrame म values को access करना व modify करना
सॊजीव भदौररया क० वव० बाराबॊकी
Column को delete करन क हलए हनमन syntax का परयोग कर |
del ltDFObjectgt[ltColNamegt] या
dfdrop([ltCol1NamegtltCol2Namegt ] axis=1)
axis =1 यह बताता ह की column को delete करना ह
del कमाॊड delete करन क बाद value return नह ॊ करता ह जबकक drop method delete करन क बाद तरॊत बची हई dataframe को return करता ह|
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
DataFrame म Iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull कभी कभी हम पर dataframe पर iteration करना पड़ता ह ऐस
म ऄलग स values को access करन क हलए code हलखना और
समसयातमक हो जाता ह | आसहलए dataframe पर itration करना
अवशयक हो जाता ह हजस हम हनमन तरीक स कर सकत ह |
bull ltDFObjectgtiterrows( ) यह dataframe को row-wise
subsets म दखता ह
bull ltDFObjectgtiteritems( ) यह dataframe को column-wise
subsets दखता ह|
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
pandasiterrows () function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
pandasiteritems() function का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
य df1 की values ह सजस एक एक करक ऐस परोसस ककया गया ह|
DataFrame बनन क बाद नीच वाऱ code को try कररए |
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
bull Write a program to iterate over a dataframe
containing names and marks then calculates grades
as per marks (as per guideline below) and adds them
to the grade column
Marks gt =90 Grade A+
Marks 70 ndash 90 Grade A
Marks 60 ndash 70 Grade B
Marks 50 ndash 60 Grade C
Marks 40 ndash 50 Grade D
Marks lt 40 Grade F
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Program for iteration
सॊजीव भदौररया क० वव० बाराबॊकी
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgtinfo ( )
ltDFgtdescribe ( )
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
कि ऄनय ज़ररी functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म कि ज़ररी functions हनमन ह-
ltDFgthead ([ n=ltngt] ) यहाा n की default value 5 होती ह |
ltDFgttail ( [n=ltngt])
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Cumulative Calculations Functions
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame म cumulative sum क हलए हनमन फकशन ह -
ltDFgtcumsum([axis = None]) यहाा axis argument वकहपपक ह |
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
bull Data analysis क हलए पाआथन एक बहत ऄछिी कपयटर भाषा ह |
bull Python pandas आस परकार क data को analyze करन क हलए कइ परकार क
data aggregation function परदान करता ह |
bull Analysis का एक महतवपरण कायण होता ह बड़ dataset का summarization
हजस aggregations को compute करना कहत ह जस- sum() mean()
median() min() और max() हजसम हवशाल dataset स एक सखया हमल
जाती ह |
bull आस ऄधयाय म हम आनही data aggregate functions का परयोग करना सीखग |
bull Aggregation का ऄथण होता ह एक हवशाल dataset की values को process
करक एक value परापत करना |
bull Data aggregation म हमशा multivalued functions कदए जात ह जो एक
single value return करत ह |
bull कदया जान वाला dataset या तो series या DataFrame होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Data Aggregation Functions
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
bull हम हनमन excel sheet
स एक dataframe
बनात ह ndash हजसका
process हनमन ह|
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत ईदहारर म अपन
दखा की परतयक column म
हबना NaN वाली values को
ही हगना गया ह |
DataFrame ldquodfrdquo म परतयक
column म परतयक row क
हलए ईपहसथत non-NaN
items को हगनकर परदरशशत
करना |
DataFrame ldquodfrdquo म स ककसी एक
column क हलए ईपहसथत non-NaN
items को हगनकर परदरशशत करना हो
तो हनमन दो तरीको म स कोइ भी तरीका
ऄपना सकत ह |
DataFrame क column
सभी non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
DataFrame क row क सभी
non-NaN values को
जोड़न क हलए हनमन तरीका
ऄपनाया जा सकता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Aggregation Description
count() कल items की सखया
sum() कदए गए सखयाओ क सट क items का sum को हल करता ह |
mean() कदए गए सखयाओ क सट क items का mean या average को हल करता
ह |
median() कदए गए सखयाओ क सट क items क बीि की सखया या median को हल
करता ह |
mode() कदए गए सखयाओ क सट क items म सबस जयादा repeated value या
mode को हल करता ह |
max() कदए गए सखयाओ क सट म स सबस बड़ी सखया को खोजता ह |
min() कदए गए सखयाओ क सट म स सबस िोटी सखया को खोजता ह |
std() कदए गए सखयाओ क सट क items का standared deviation calculate
करता ह |
var() कदए गए सखयाओ क सट क items का variance calculate करता ह |
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Data Aggregation Functions
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment State wise sales values of an item is given below- State Sales Goa 650000 Delhi 692400 Odisha 750000 Haryana 867000 Bihar 920000 Kerala 939000 Tamil Nadu 1015000 West Bengal 1553000 Maharashtra 2176000 Write Commands for the following (Dataframe name is dfA) (a) Count the number of observation in dfA (b) Count the number of observation in column state of dfA (c) Sum of the non-null value across the row axis for dfA (d) Calculate the mean of Sales columns in dfA (e) Add a commission column into dfA (Commission = sales004) (f) Calculate the mean of all numeric columns in dfA (g) Calculate the mean of sales column (h) Find maximum sales and commission values (i) Find minimum sales and commission values (j) Find the standard deviation of commissions
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Quantiles with Pandas bull Statistics म 3 शबद बहत परयोग म लाय जात ह - Quartile Quantile और
percentile आनम हनमन ऄतर होता ह |
ndash 0 quartile = 0 quantile = 0 percentile
ndash 1 quartile = 025 quantile = 25 percentile
ndash 2 quartile = 050 quantile = 50 percentile
ndash 3 quartile = 075 quantile = 75 percentile
ndash 4 quartile = 1 quantile = 100 percentile
bull Statistics म Quartile अपक data को 4 हहससो (quarter) म बााट दता ह |
bull Percentile एक सखया ह जहा एक हनहित percentage सकोर ईस सखया स
नीि अता ह | आनका परयोग ऄहधकतर परीकषा आतयाकद म सकोर को ररपोटण करन म
ककया जाता ह |
ndash Percentile = ((N-your Rank)N)100
ndash Your rank = (percentile100) number of items
bull Quantiles एक distribution म वह point ह जो ईस distribution म values
क rank order स सबहधत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Pandas म Quantile () का परयोग bull Pandas का quantile() function ककसी request ककय गए axis क हलए
float ऄथवा series values को return करता ह | request ककया गया axis
एक numpy percentile होता ह | यह एक probabilities की list होती ह हजस
पर quantile compute ककया जाना ह |
ndash माना यकद percentile = 25 ह तो यह पहला quartile ऄथवा lower quartile होगा |
ndash यकद percentile = 50 ह तो यह दसरा quartile ऄथवा median होगा |
ndash यकद percentile = 75 ह तो यह तीसरा quartile ऄथवा upper quartile होगा |
bull आसका syntax हनमन ह ndash
DataFramequantile(q=05 axis=0 numeric_only=True interpolation = lsquolinearrsquo)
bull जहाा -
ndash q एक float ह या array क जसा आसका default 05 (50 quantile) और 0lt=qlt=1
ndash axis 0 ऄथवा lsquoindexrsquo और 1 ऄथवा lsquocolumnsrsquo | आसका default 0 होता ह |
ndash numeric_only boolean default True होता ह |
ndash interpolation lsquolinearrsquo rsquolowerrsquo rsquohigherrsquo rsquomidpointrsquo rsquonearestrsquo यह वकहपपक
(optional) होता ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the Quantile of an odd series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Find the Quantile of an even series s given bellow
अप हनमन कमाड भी try कर
सकत ह |
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Pandas म Quantile () का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
Find the quantile of DataFrame ldquodfrdquo
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Descriptive Statistics bull Python ndash pandas म descriptive या summary statistics क हलए describe ( )
function का परयोग ककया जाता ह |
bull Describe ( ) क दवारा mean std और interquartile (IQR) values को हाहसल ककया
जा सकता ह |
bull Describe ( ) एक numeric columns पर काम करन क हलए बहत ही असन function
होता ह |
bull ककसी column क basic statistics को दख क हलए अप describe ( ) function का परयोग
कर सकत ह ndashजस - mean min max आतयाकद |
bull सामानयतया describe ( ) character columns को िोड़ दता ह और हसफण numeric
columns पर कायण करता ह |
bull ककसी dataframe को describe करन पर हसफण numeric fields ही return होती ह | और
यह 8 परकार की statistical properties को दशाणता ह -
count( ) mean()
std() min()
25th percentile 50th percentile
75th percentile max()
सॊजीव भदौररया क० वव० बाराबॊकी
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Descriptive Statistics bull Describe ( ) function का syntax हनमनवत ह -
DataFramedescribe(percentile = None include = None exclude=None)
जहाा -
ndash percentile default ह [025 05 075 ]
ndash Include default None ह ऄनय म lsquoAllrsquo होसकता ह |
ndash Exclude भी default None ह यह तब परयोग म लाया जाता ह जब अप ककसी भी column को आनकलड़ न
करना िाह |
सॊजीव भदौररया क० वव० बाराबॊकी
STRING टाआप क series क
हलए |
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Descriptive Statistics
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrame क हलए
describe( ) function
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Descriptive Statistics (Assignment)
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram ककसी data क distribution को analyze करन क हलए एक powerful टल
ह |
bull एक histogram plot को सामानयतया ककसी सखया की frequency को दशाणन क हलए
परयोग ककया जाता ह |
bull आसक दवारा user को data का हवहभनन catagory म distribution असानी स समझ म
अजाता ह | तथा साथ ही data की median और range भी समझ अजाती ह |
bull Histogram बनान क हलए पहल हम values की परी range को intervals की एक
series म हवभाहजत करत ह और दसरा हम हगनत ह कक परतयक interval म ककतन values
अत ह|
bull Matplotlib कफर bins म ईन categories या intervals को call करता ह | bins
variables क continuous और non-overlapping intervals होत ह व एक दसर क
ठीक लग हए (adjacent) और बराबर size क होन िाहहए|
bull Histogram म -
X ndash axis observation क intervals को दशाणता ह |
Y- axis यह frequency क घनतव (density) को दशाणता ह |
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Matplotlib
सॊजीव भदौररया क० वव० बाराबॊकी
bull Matplotlib पाआथन की एक ऄगररी visualization library ह जो कक एक powerful और
two dimentional plotting library ह |
bull यह numpy arrays क अधार पर बनी हइ एक multi-platform data visualization
library ह |
bull यह सभी परकार क graph plots charts histograms आतयाकद बनान म सकषम ह |
bull आसक हलए अपको ऄपन system म pip कमाड क दवारा matplotlib library को install
करना होता ह |
आस कमाड स हम पता कर
सकत ह की matplotlib का
कौन सा version installed
ह |
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
bull Histogram बनान क हलए syntax हनमन ह -
bull Example क हलए हम हनमन DataFrame लत ह -
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
Histogram बनान क हलए hist( ) function का
परयोग करत ह |
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Pandas dataframe स single Histogram बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column pass कर दत ह |
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Histogram क bins क अकार को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column क
साथ bins को भी pass कर दत ह |
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Multiple pandas Histogram
सॊजीव भदौररया क० वव० बाराबॊकी
ईपरोकत कमाड िलान पर
बगल म दशाणइ गयी िहव जो
histogram बन कर अरहा ह
वही output अपको परदरशशत
होता ह |
hist ( ) function म column को
भी pass कर दत ह |
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Histogram Axes को बदलना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Multiple features in one plot
सॊजीव भदौररया क० वव० बाराबॊकी
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Plotting DataFrame Columns using DataFrame plot () Method
सॊजीव भदौररया क० वव० बाराबॊकी
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Histogram using singlemultiple column
सॊजीव भदौररया क० वव० बाराबॊकी
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Assignment
सॊजीव भदौररया क० वव० बाराबॊकी
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Function Application
सॊजीव भदौररया क० वव० बाराबॊकी
bull Pandas library कइ सहवधाजनक function परदान करती ह जो data
science स समबहधत कइ कायो को करन म सहायता करत ह | functions क
ऐस कायो को function application कहत ह |
bull एक तरह स यह भी कह सकत चह की functions को dataframe क साथ कइ
तरीको स परयोग ककय जान को function application कह सकत ह ndashजस -
bull समपरण dataframe पर
bull Row wise ऄथवा column-wise
bull ककसी individual value पर ऄथाणत element ndash wise
bull आस करम म तीन परकार क function होत ह ndash
bull pipe ( ) dataframe wise function application
bull apply ( ) row-wisecolumn-wise function application
bull applymap ( ) element-wise function application
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
bull कइ बार हम ऐस काम करना पड़ता ह कक एक function का output दसर function
क हलए आनपट का काम करगा और तब process अग बढ़गी | आस ही pipe करना
कहत ह | हनमन ईदहारर को दख -
bull आस ईदहारर म पहल sqrt ( ) function का output अयगा जो की pow ( )
function क हलए आनपट का काम करगा | ऄथाणत य function pipe म काम कर रह
ह |
bull pipe ( ) function सार functions क अडणर को बदल कर ईस करम म लाता ह हजस
करम म वह execute हो रह ह |
pipe function क अनदर pass ककय गए Function क साथ parenthesis नह ॊ दत ह |
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
pipe ( ) function
सॊजीव भदौररया क० वव० बाराबॊकी
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
apply ( ) और applymap ( )function
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ single value परनत column return हो रह ह | कयोकक apply( ) एक series का function ह
जबकक यहाॉ single value परनत element return हो रह ह | कयो कक applymap ( ) एक element का function ह |
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Missing Data को handle करना
सॊजीव भदौररया क० वव० बाराबॊकी
bull वह values जो ककसी computation म हहससा नही ल पाती ह या यो कह कक
missing values वह values होती ह हजनका कोइ computational
significance नही होता ह |
bull Missing data को handle करन क हलए हनमन तरीक ऄपनाय जात ह -
Dropping missing data
Filling missing data (Imputation)
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Comparison of Pandas Objects
सॊजीव भदौररया क० वव० बाराबॊकी
equals () दोनो ऑबजकट की बराबर check करता ह |
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Pivoting DataFrame bull Data analysis क हलए Pandas एक परिहलत library ह |
bull ककसी भी data analyst क हलए परमख कायो म स एक डटा टबल को pivot करना ह ऄथाणत table data को एक धरी परदान करना हजसक अधार पर
database काम कर |
bull Pandas का परयोग करक MS-Excel क परकार क pivot tables बनाय जा
सकत ह |
bull य बड़ data को तरत summarize करक meaningful reports तयार करन म
अपक समय की बहत बित करत ह |
bull Pivot table हम एक बड़ हवसतत डटा सट स महतवपरण record हनकालन की
ऄनमहत दती ह
bull Pivot tables सवतः sort count total आतयाकद कर लती ह |
bull एक सामानय बात कह तो pivot करन का ऄथण ह ककसी index या column स
unique value को परयोग करना और DataFrame बनाना |
bull Pandas क दवारा pivot table बनान क हलए हम pivot( ) या pivot_table() method का परयोग करत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
pivot( ) method का परयोग करक Pivoting करना bull pivot() method column values क अधार पर data को reshape करक नया
DataFrame बनाता ह |
bull यह method 3 arguments लता ह - index columns और values | आनम स 2
को लना ऄहनवायण ह |
bull आन arguments की value क रप म अपको original table क column नाम दन होत
ह |
bull तब pivot ( ) एक नयी table बनाता ह हजनक row और column क index वही होत ह
हजनको अपन argument क रप म pass ककया ह |
bull नयी table की cell values ईसी column स अयगी हजसको अपन parameter क रप
म कदया था | आसका syntax हनमन ह ndash
pandaspivot(index columns values) bull जहाा index क दवारा नए DataFrame का index बनता ह जो table स हलया गया column
name ह |
bull जहाा columns क दवारा नए DataFrame क columns बनत ह जो table स हलए गए
column name ह |
bull जहाा values क दवारा नए DataFrame की columns बनती ह जो table स हलए गए
column name की values ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
pivot( ) method का परयोग करक Pivoting करना syntax pandaspivot(index columns values)
bull ईदाहरर DataFrame बनाना
bull pivot table बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
सवतः ही िला गया ह |
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
pivot( ) method का परयोग fillna( ) क साथ syntax pandaspivot(index columns values)fillna()
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
हम आस pivot table म दख सकत ह कक एक नयी
table बनी ह और Score column की values
ऄलग ऄलग column म अयी ह | जबकक आसकी
Name और Subject column original
table स match हो रही ह| जहाा values
match नही हो रही ह ईस जगह NaN (None)
भी नही अया बस ररकत सथान अगया ह |
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Multiple columns क दवारा pivoting करना आसम बस values parameter को हटा दत ह |
syntax pandaspivot(index columns)
bull ईदाहरर DataFrame बनाना
bull pivot table fillna( ) क साथ बनाना बनाना
सॊजीव भदौररया क० वव० बाराबॊकी
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Multiple columns क दवारा pivoting करना bull हपिल ईदहारर म हमन दखा कक कइ index बन गए Subjects
क और ईनकी values भी एक बार Score क हलए और एक बार
Grade क हलए परतयक नाम क हलए कदखाइ गयी ह |
bull आनह हम कफ़पटर भी कर सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Pivot Problem bull हमशा धयान रहखय यकद index और columns क multiple values क साथ
combination होग तो value error अयगी |
सॊजीव भदौररया क० वव० बाराबॊकी
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
stack( ) और unstack( ) methods का परयोग bull stack( ) और unstack( ) methods दोनो DataFrame का layout पलट दत ह
ऄथाणत columns क सार levels को row म और row क सार levels को column म
पलट दत ह | DataFrame की stacking का मतलब ह innermost column index
को innermost row index की ओर ल जाना | और आसक ईलट करम को unstacking कहत ह |
सॊजीव भदौररया क० वव० बाराबॊकी
Stack Method का परयोग
Stack Method का परयोग करन पर subjects जो horizontal म थ वो सभी vertical अगय | और यहाा यह column breakdown म last level ऱता ह और इस last row breakdown म बदऱ दता ह
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
आस तरह स भी stack का परयोग ककया जा सकता ह हजसक
stacking क बाद पनः stacking की गयी ह तो आसम यह बि
हए column level को भी move कर दता ह |
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
stack( ) और unstack( ) methods का परयोग
सॊजीव भदौररया क० वव० बाराबॊकी
यह unstacking ह
Unstacking भी stack क जस ही
होती ह बस ईसम एक argument lsquo0rsquo pass
कर कदया जाता ह |
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
pivot_table( ) method का परयोग करक Pivoting करना bull यह pivot( ) method का generalization ह |
bull जब अपक पास एक ही index या column क हलए duplicate values हो तो
pivot_table( ) method का परयोग ककया जाता ह |
bull एक pivot table म counts sums तथा table data स समबहधत ऄनय functions भी
ईपलबध होत ह |
bull pivot_table( ) method एक परकार स excel sheet जसी ही DataFrame बनाती ह |
bull यह भी row को column म और column को row म बदलन क काम अता ह |
bull यह ककसी भी data field की grouping को allow करता ह |
bull आसका syntax ह
pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक
ऄनदर कि default values होती ह |
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
pivot_table( ) method का परयोग करक Pivoting करनाhellip pandaspivot_table (DataFrame values=None index=None
columns=None aggfunc=lsquomeanrsquo
fill_value=None margins=False dropna=True
margins_name=lsquoAllrsquo)
bull pivot_table() method म सार arguments ज़ररी नही ह कयोकक आसक ऄनदर कि
default values होती ह |
bull आसक syntax म -
ndash DataFrame एक pandas DataFrame ह |
ndash valuesयह optional ह और aggregate ककय जान वाला column ह |
ndash indexcolumn grouper array या list का नाम ह |
ndash columnsयह column grouper array या list ह |
ndash aggfunc aggregation function ह |
ndash fill_valueआसक दवारा हम default values सट कर सकत ह यकद values न दी गयी हो |
ndash margins यह एक boolean होता ह हजसका default false होता ह यकद हम आस true
कर दत ह तो resulting dataframe म row और column का sum भी जड़ जाता ह |
ndash dropnaयकद यह true ह तो यह missing data वाली row को drop कर दता ह |
ndash margins_name=lsquoAllrsquo जब margins true हो तब total वाल row और column क
नाम रखता ह | सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
pivot_table( ) method का परयोग करक Pivoting करना hellip हम हनमन data को consider करक pivot table बनात ह
या
सॊजीव भदौररया क० वव० बाराबॊकी
हम यह data CSV फाआल स भी le सकत ह|
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
pivot_table( ) method का परयोग करक Pivoting करना hellip pivot table को हम हनमन तरीक स भी बना सकत ह
सॊजीव भदौररया क० वव० बाराबॊकी
यहाॉ aggfunc क values पर धयान द सजय |
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
pivot_table( ) method का परयोग करक Pivoting करना hellip
अपक हलए एक excercise
सॊजीव भदौररया क० वव० बाराबॊकी
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
pivot_table( ) method का परयोग करक Pivoting करना hellip
Solution
सबस पहल अप दी गयी table का DataFrame बनायग pandas का परयोग
करक |
ईसक बाद अपको हनमन function ऄपलाइ करन ह -
सॊजीव भदौररया क० वव० बाराबॊकी
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
DataFrames की Sorting bull DataFrame क data को भी row और column क values क अधार पर sort
ककया जा सकता ह |
bull By default sorting row labels पर होती ह वो भी बढ़त हए करम म |
bull Pandas DataFrames क पास दो ईपयोगी sort functions होत ह
ndash sort_values( ) यह function कदए गए column क data को ascending या
descending अडणर म sort करता ह |
ndash sort_index( ) यह function rows (axis=0) या columns (axis=1) को sort करता ह
bull आनका syntax हनमनवत ह
bull DataFramesort_values(by = None axis=0 ascending = True inplace = False)
bull DataFramesort_index(by = None axis=0 ascending = True inplace = False)
bull यहाा ndash bull by sort ककया जान वाला column
bull axis यहाा 0 pass करन का मतलब सोरटटग row wise और 1 का मतलब column wise
bull ascending default म ascending true रहता ह
bull inplace default false होती ह यकद अप नया dataframe नही िाहत ह तो true pass करना होगा |
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
यहाा by default ascending अडणर म sort हअ ह |
DataFrames की Sorting
सॊजीव भदौररया क० वव० बाराबॊकी
या
Descending अडणर म sort करन क हलए हनमन ईदाहरर ह |
Ascending parameter की वपय False
pass कर दी ह |
यहाा यकद हम दो column आस
परकार स ददत ह तो multiple
columns पर sorting apply हो
जाती ह |
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
Sort by index
सॊजीव भदौररया क० वव० बाराबॊकी
यहाा यह ascending अडणर म
sorting ह |
यहाा यह descending अडणर म
sorting ह |
याद रखन योगय बात 1 pivot( ) method एक नयी table बनाता ह हजनक row और column unique होत ह |
2 pivot( ) method का ईपयोग aggregation क हबना pivot क हलए ककया जाता ह
3 stacking का मतलब ह innermost column index को innermost row index की ओर ल
जाना |
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom
bull कपया हमार बलॉग को फॉलो कररए और youtube channel
को subscribe कररए | ताकक अपको और सार chapters
हमल सक |
wwwpythontrendswordpresscom