Python 08d 3

 0    18 flashcards    swiatangielskiego
download mp3 print play test yourself
 
Question Answer
stwórz df na podstawie csv
start learning
df = pd. read_csv('movie_metadata. csv', index_col='movie_title')
zapisz df do csv
start learning
df. to_csv(path_or_buf='new_students_data. csv')
suma wszystkich wartości Null
start learning
df. isnull(). sum()
usuwanie duplikatów
start learning
df. drop_duplicates(inplace=True) df. drop_duplicates()
usunięcie kolumny
start learning
df. drop(columns='col')
zliczanie values w df
start learning
df['genres']. value_counts()
łączenie warunków w df
start learning
df_budget = df[(df['budget'] > budget_mean) & df['budget'] > 1000]
zastosuj funkcję wzdłuż osi df
start learning
df['kolumna']. apply(function)
zwraca indeksy maksymalnej wartości
start learning
df['kolumna']. values. argmax()
Indeksowanie oparte wyłącznie na liczbach całkowitych do wyboru według pozycji wiersze kolummu
start learning
df. iloc[0] df. iloc[1:11, [3, 4]] df. loc[:, "col"])
Indeksator oparty wyłącznie na etykietach do wyboru według etykiety.
start learning
df. loc['kolumna']
dzieli i dodaje do listy po przecinku na podstawie znaku w nawiasie
start learning
df['kolumna']. str. split(pat='|') df['kolumna']. str. split('|')
dzieli na kolumny na podstawie znaku w nawiasie
start learning
df['genres']. str. split(pat='|', expand=True)
tabelę krzyżową dwóch (lub więcej) czynników
start learning
pd. crosstab(df['col1'], df[column], normalize='columns')
kategorie panda
start learning
pd. Categorical(['a','b','c','a','b','c'], ordered=True, categories=['c', 'b', 'a'])
jednowymiarowa tablica kolumna panda
start learning
pd. Series(list)
Zwraca serię kodów oraz indeks
start learning
pd. Series. cat. codes
kategoryzacja
start learning
pd. cut(df[col], bins=[0, 5, max(df[col])], include_lowest=True)

You must sign in to write a comment