반응형 분류 전체보기88 판다스(Pandas)에서 엑셀, CSV 파일 불러오기 기초 서론 판다스는 데이터프레임을 생성하는 다양한 함수를 내장하고 있다. 아마 그 가운데 가장 빈번하게 사용하는 것은 엑셀 파일이나 CSV 파일을 불러다 사용하는 방법일 것이다. 공공데이터포털에서 제공하는 자료 등 판다스 사용자가 분석하고자 하는 많은 데이터들이 엑셀 또는 CSV 파일 형식으로 되어 있다. 이 글에서는 엑셀과 CSV 파일을 판다스의 데이터프레임으로 불러오는 기초적인 방법을 소개한다. 본론 판다스에서 엑셀 파일을 불러오는 방법과 CSV 파일을 불러오는 방법은 많은 부분에서 동일하므로 같이 소개한다. 여기에 소개하는 내용과 앞으로 몇 개의 포스팅에 걸쳐 소개할 내용은 판다스 홈페이지의 API reference 페이지에서 더 상세하게 확인할 수 있다. 링크를 타고 가서 Input/Output 메뉴를.. 2021. 11. 20. 판다스(Pandas) 교재 추천, 책 추천/파이썬 라이브러리를 활용한 데이터 분석 서론 판다스를 배울 수 있는 자료는 넘쳐난다. 우선, 판다스의 공식 홈페이지에서 튜토리얼을 제공한다. 그뿐 아니라 파이썬의 인기 비결 중의 하나가 판다스라고 할 만큼 대중적이고 유명한 라이브러리이기 때문에, 파이썬을 다루는 웹페이지, 유튜브 채널 등은 거의 예외 없이 판다스를 다루고 있다. 이것저것 많은 자료들이 있으나 책으로 출판된 것이 아무래도 체계적이고 정제된 느낌이어서 학습하기에는 더 편한 것 같다. 많고 많은 판다스 책 중에 끝판왕이라 할 만한 책을 소개한다. 본론 필자가 소개할 책은 "파이썬 라이브러리를 활용한 데이터 분석"이다. 교보문고 링크 표지에서 뭔가 전문서적의 느낌이 물씬 난다. 1. 저자 소개 왜 이 책이 끝판왕이라고 소개하게 됐는지를 보자. 이 책의 지은이는 웨스 맥키니라는 분이라.. 2021. 11. 20. 스마트폰에서 주피터노트북(Jupyter notebook) 사용하는 방법/Pydroid 3, 태블릿, 안드로이드 서론 파이드로이드를 소개하는 글에서 간단한 예제로 판다스 데이터프레임을 출력해봤다. 그런데 판다스는 주로 주피터노트북에서 사용한다. 데이터를 만지면서 바로바로 결과를 확인하기에 주피터노트북만한 게 없다. 그렇다면 파이드로이드에서도 주피터노트북을 쓸 수 있을까? 역시 쓸수 있다. 본론 파이드로이드를 실행하고 Pip 메뉴로 들어가보자 INSTALL 메뉴에서 jupyter를 입력하거나, QUICK INSTALL 메뉴에서 jupyter를 찾아 INSTALL한다. 이것으로 설치가 끝났으니 이제 사용해보자. Pip 메뉴 바로 위에 있는 Terminal을 누른 뒤, jupyter notebook을 입력한다. 브라우저가 뜨면서 주피터노트북의 파일 관리 화면이 표시될 것이다. 오른쪽 위편의 New버튼을 누르고, Pyth.. 2021. 11. 18. 스마트폰에서 파이썬(Python) 코딩하는 방법/Pydroid 3, 태블릿, 안드로이드 서론 한창 코딩 공부에 빠져 있다 보면, 출퇴근길이나 자투리 시간에 핸드폰으로 파이썬 코드를 실행해볼 방법이 없을까 하는 생각을 하게 된다. 그게 가능할까? 코딩을 배우면서 느낀 점이 있는데, '가능할까?' 하고 찾아 보면 안 나오는 게 없다. 누군가는 이미 같은 생각을 했고, 이미 너무너무 잘 만들어 놓은 수많은 툴들이 존재한다. 자투리 시간에 스마트폰으로 파이썬 튜토리얼이나 각종 라이브러리의 Document같은 것들을 보면서, 지금 바로 실행해보고 싶다는 생각을 하고 있다면, 파이드로이드(Pydroid)를 설치해보자. 본론 스마트폰에서 파이썬 코딩하기, 정말 간단하다. 구글 스토어에 들어가서 Pydroid를 검색한다. 아래와 같은 아이콘의 앱이 나올 것이다. 다운로드를 해준다. 설치된 앱을 실행해보자.. 2021. 11. 17. 깃(Git) 명령어 모음(git cheat sheet), 터미널에서 푸시하는 방법 나의 깃 레포지토리(git repository)에 내가 작성한 코드를 커밋하고, 깃허브로 푸시하고, 풀하는 방법은 다양하다. 필자가 사용 중인 코드 편집기인 비주얼스튜디오 코드(VS Code)에서도 소스 제어 기능을 제공하고 있으므로 간단하게 버튼 몇 개만 누르면 깃을 사용할 수 있다. 다만 가끔은 마우스로 손을 옮기고, 작은 버튼을 찾아 누르는 작업이 귀찮을 때가 있다. 그럴 땐 터미널을 열어서 깃 명령어를 직접 입력하면 되는데, 완전히 익숙해지기 전까지는 매번 명령어를 찾아보게 된다. 이럴 때 도움이 될 만한 자료를 찾아 공유한다. 주요 깃 명령어를 정리해 놓은 git cheat sheet이다. 깃허브의 공식 자료로 보이는데, 깃허브 홈페이지에서 열람할 수도 있고, 구글에 git cheat sheet.. 2021. 11. 16. 판다스(Pandas) 주요 함수(명령어) 모음(정리표, cheat sheet) 무려 판다스 공식 홈페이지에서 제공하는 판다스 함수 모음이다. 기초적이고 유용한 함수 위주로 정리가 잘 되어 있다. 그 중에 몇 가지만 살펴보자. 쿼리(query) 함수이다. 쿼리 함수를 이용하면 데이터를 매우 편하게 필터할 수가 있는데, 판다스 관련 튜토리얼 자료에서는 잘 다루지 않는 것 같다. 조건을 입력할 때 문자열(str)로 입력하는 것에 주의한다. isin 함수를 활용한 데이터 매칭(join) 방법도 소개하고 있다. 데이터프레임의 일부 열과 행을 선택하는 iloc과 loc 함수의 활용 유형도 보여주고 있는데, 제일 아래의 조건식을 이용한 활용법이 눈에 띈다. 위에 소개한 것들은 유튜브나 구글 검색을 통해 접할 수 있는 판다스 학습자료에서 자주 보지 못했던 것 같은 내용들이며, 그밖에도 판다스를 .. 2021. 11. 16. 이전 1 ··· 11 12 13 14 15 다음 반응형