본문 바로가기

판다스5

[파이썬] 판다스 두 개의 열 또는 데이터프레임이 같은지 확인하는 법 1. 두 개의 열이 같은지 확인하는 방법 - A 데이터프레임의 특정 열 a와 B 데이터프레임 특정 열 b가 서로 같은지 확인 import pandas as pd # 예시 데이터 프레임 생성 df_A = pd.DataFrame({'a': [1, 2, 3], 'x': ['a', 'b', 'c']}) df_B = pd.DataFrame({'b': [3, 2, 1], 'y': ['d', 'e', 'f']}) # df_A의 'a'열과 df_B의 'b'열 비교 df_A['a'].equals(df_B['b']) 데이터프레임 A의 a열과 데이터프레임 B의 b열은 서로 다르기 때문에 False의 결과가 나온다. 2. 두 개 열이 다르다면 어디가 다른지 찾기 # df_A의 'a'열과 df_B의 'b'열 비교하여 차이점 찾.. 2024. 1. 18.
[파이썬] 판다스 데이터프레임 loc 및 iloc 정확하게 이해하기 파이썬에서 데이터 분석에 자주 사용되는 라이브러리인 판다스(Pandas)에서 loc와 iloc는 데이터프레임(테이블이라고도 할 수 있는)의 데이터 일부를 선택하는데 사용되는 방법들이다. loc와 iloc는 겉보기엔 비슷하게 생겨 헷갈리는 경우가 많은데 이에 대해 명확하게 이해하고자 한다. 1. loc와 iloc란 loc: location의 약어로 레이블 기반의 인덱싱 방법으로 레이블 이름, 컬럼 이름 등으로 데이터를 추출하는 방법 iloc: integer location의 약어로 행이나 컬럼의 순서를 나타내는 정수로 데이터를 추출하는 방법 (*파이썬에서는 0부터 인덱스가 시작) 2. loc와 iloc의 예시 - 데이터프레임 만들기 import pandas as pd data = { '도시': ['서울',.. 2024. 1. 17.
[파이썬] csv 및 Excel 가져오기, 내보내기 데이터를 분석하기 위해 가장 선행되어야 하는 것은 당연 데이터를 불러오는 것이다. 정말 기초 중에 기초지만, 가끔 기억이 안날 때가 있다. (물론 구글 또는 ChatGPT에 물어보면 10초도 안되어 알 수 있다.) 다시 한번 상기하고자 이렇게 정리해본다. 먼저 CSV 및 Excel을 가져오기 위해서는 pandas를 불러와야 한다. pandas를 불러오고 나서 csv를 가져오는(불러오는) 코드는 아래와 같다. csv 불러오기 import pandas as pd df = pd.read_csv('23-24 프리미어리그 득점순위(240104 기준).csv') df 그리고 csv를 가져올 때, 여러 옵션(seps, header, index_col, usecols, encoding 등)이 있다. 1. seps: 구.. 2024. 1. 4.
[파이썬] 데이터프레임 다루기(특정 행 및 열 추출, 컬럼 추가, 수정 등) 본 포스트에서는 데이터프레임을 다루는 여러가지 코드에 대해 알아본다. 먼저 데이터는 아래와 같다. import pandas as pd # 예시 데이터 data = { '도시': ['서울', '부산', '대구'], '인구': [1000, 500, 300], '면적': [605.21, 770.04, 883.56] } # 데이터프레임 생성 df = pd.DataFrame(data) 1. 특정 행 또는 열을 추출하는 방법 - 특정 열 추출: df['컬럼명'] - 여러 열 추출: df[['컬럼1', '컬럼2']] - 특정 행 추출: df.loc[행의 레이블] - 특정 행 추출: df.iloc[행의 인덱스] *loc와 iloc가 얼핏 보면 같아 보이지만, loc는 레이블 이름을 기준으로 하는데 반해, iloc는 인.. 2024. 1. 4.