반응형

판다스 디테일 7

[python] 라이브러리에서 _로 시작하거나 _로 끝나는 요소

파이썬에서 보통 이름이 밑줄(_)로 시작하고 끝나는 요소들은 보통 내부적인 사용을 목적으로 하는 "내부 요소"를 의미합니다. 몇 가지 주요 예시는 다음과 같습니다:Single Leading Underscore (_var): 보통 내부적인 사용이나 관례적으로 private한 변수를 나타냅니다. 이는 클래스 내에서 사용되는 것을 의도하거나, 모듈 내에서 다른 함수에 의해 호출되는 것을 방지하기 위해 사용될 수 있습니다.Single Trailing Underscore (var_): 키워드와 충돌을 방지하기 위해 변수 이름에 밑줄을 추가할 때 사용됩니다. 예를 들어, 변수명이 파이썬 키워드와 겹칠 경우 밑줄을 추가하여 충돌을 피할 수 있습니다.Double Leading Underscore (__var): 이는 ..

판다스 디테일 2024.06.17

[Pandas] datetime 형식 코드

Python의 datetime 모듈에서 제공하는 형식 코드들을 사용해야 합니다. 이 모듈에서 지원하는 형식 코드들은 다음과 같습니다:%Y: 4자리 연도 (예: 2024)%y: 2자리 연도 (예: 24)%m: 2자리 월 (01에서 12)%d: 2자리 일 (01에서 31)%H: 2자리 시간 (24시간제, 00에서 23)%I: 2자리 시간 (12시간제, 01에서 12)%p: AM 또는 PM%M: 2자리 분 (00에서 59)%S: 2자리 초 (00에서 59)%f: 마이크로초 (000000에서 999999)%z: UTC 오프셋 (예: +0000)%Z: 타임존 이름 (예: UTC, EST)%j: 3자리 연도 일수 (001에서 366)%U: 1년 중 주 번호 (00에서 53, 일요일 시작)%W: 1년 중 주 번호 (..

판다스 디테일 2024.06.15

[Pandas] DataFrame 결합, 추가 관련 append, join, concat, merge

pandas 라이브러리에서 DataFrame을 결합하거나 추가하는 데 사용되는 주요 메서드에는 append, join, concat, merge가 있습니다. 각각의 기능과 사용 예를 비교하여 설명하겠습니다.1. append기능: DataFrame의 끝에 또 다른 DataFrame이나 Series를 추가합니다.축: 기본적으로 행(axis=0)으로 추가합니다.사용 예: 데이터가 행 단위로 추가되는 경우.import pandas as pddf1 = pd.DataFrame({'A': [1, 2], 'B': [3, 4]})df2 = pd.DataFrame({'A': [5, 6], 'B': [7, 8]})# append 사용 예시result = df1.append(df2, ignore_index=True)print..

판다스 디테일 2024.06.15

[Pandas] DataFrame에서 inf 값을 포함하는 행 지우기

pandas DataFrame에서 inf 값을 제거하려면 replace 함수를 사용하여 inf 값을 NaN으로 바꾼 후 dropna 함수를 사용하여 NaN 값을 포함하는 행을 제거할 수 있습니다. 이렇게 하면 inf 값을 제거한 DataFrame을 얻을 수 있습니다.다음은 예제 코드입니다:import pandas as pdimport numpy as np# 예제 DataFrame 생성data = { 'A': [1, 2, np.inf, 4], 'B': [5, np.inf, 7, 8], 'C': [9, 10, 11, np.inf]}df = pd.DataFrame(data)print("원본 DataFrame:")print(df)# inf 값을 NaN으로 대체df.replace([np.inf, ..

판다스 디테일 2024.06.15

[Pandas] DataFrame.crosstab() 사용하기

pd.crosstab 함수는 Pandas에서 교차표(또는 분할표)를 생성하는 데 사용됩니다. 교차표는 두 개 이상의 범주형 변수 사이의 관계를 보여주는 표로, 각 변수의 고유한 값의 조합에 대한 빈도 수를 계산합니다. 이는 주로 데이터 분석과 통계적 분석에서 유용합니다.기본 사용법pd.crosstab 함수의 기본 사용법은 다음과 같습니다:pd.crosstab(index, columns, values=None, rownames=None, colnames=None, aggfunc=None, margins=False, margins_name='All', dropna=True, normalize=False)주요 매개변수index: 교차표의 행을 구성할 변수 또는 변수를 포함하는 배열/Series.columns:..

판다스 디테일 2024.06.15

[Pandas] Series.str.contains에서의 정규식 패턴 사용

정규식(Regular Expression, RegEx)은 문자열에서 특정한 패턴을 찾거나 조작하기 위해 사용되는 강력한 도구입니다. 정규식 패턴은 문자열을 검색, 일치 여부 판단, 대체 등을 수행하기 위해 작성된 규칙의 집합입니다. 정규식은 다양한 프로그래밍 언어에서 지원되며, 문자열 조작을 더 효율적이고 유연하게 할 수 있게 해줍니다.정규식 패턴의 기본 구성 요소문자 클래스:[abc]: 'a', 'b', 'c' 중 하나와 일치.[a-z]: 소문자 알파벳 중 하나와 일치.[A-Z]: 대문자 알파벳 중 하나와 일치.[0-9]: 숫자 중 하나와 일치.[^abc]: 'a', 'b', 'c'가 아닌 문자와 일치 (부정).특수 문자:.: 임의의 한 문자와 일치.^: 문자열의 시작을 의미.$: 문자열의 끝을 의미...

판다스 디테일 2024.06.15

[Pandas]리스트 요소를 조건으로 사용하는 람다 표현식, 리스트 컴프리핸션

1. 람다 표현식주어진 코드에서 'table_list'에서 'table_name' 컬럼 값에 'letter_x'리스트의 요소가 포함되지 않은 행들을 필터링하여 새로문'table_llst'를 생성하는 방법은 다음과 같습니다.letter_x= ['pkg','fdy']table_list = table_list[~table_list['table_name'].apply(lambda x: any(letter in x for letter in letter_x))]table_list = table_list.reset_index(drop=True)위 코드에서는~'연산자를 사용하여 필터링 조건을 부정하고, any 함수를 사용하여 'letter_x 리스트의 요소 중 하나라도 'table_name'에 포함되어 있는지 확인합니..

판다스 디테일 2024.06.13
반응형