[웹 스크래핑] 웹 스크래핑(web scraping)의 이해
·
📊 데이터 분석/🕷️ 웹 스크래핑 web scraping
안녕하세요 코드웍스입니다.이번 포스팅에서는 웹 스크래핑(web scraping)에서 많이 사용되는 라이브러리인 beautifulsoup의 기본적인 사용법에 대해 소개해드리려고합니다.시작해볼까요?😎1. 웹 스크래핑웹 스크래핑(Web Scraping)은 웹사이트에서 필요한 공개된 데이터를 자동으로 수집하는 기술을 의미합니다. 웹 스크래핑을 통해 우리는 특정 웹사이트에서 원하는 정보를 추출하고 분석할 수 있습니다.1.1 웹 스크래핑 예시실제 웹 스크래핑을 이용한 사이트의 예시를 볼까요?가격 비교 서비스전자 상거래 사이트에서 상품의 가격 정보를 수집하여 소비자에게 가격 비교 서비스를 제공하는 대표적인 예가 있습니다. 여러 쇼핑몰에서 동일한 상품의 가격을 스크래핑하여 한 곳에서 비교할 수 있게 해주는 것이 목적..
[웹스크래핑] Requests 라이브러리: HTTP 요청의 모든 것
·
📊 데이터 분석/🕷️ 웹 스크래핑 web scraping
안녕하세요 코드웍스입니다.오늘은 웹 스크래핑의 핵심 도구인 Python requests 라이브러리와 HTTP 통신의 기본 개념에 대해 자세히 알아보겠습니다. 실제 개발 현장에서 가장 많이 사용되는 이 라이브러리의 활용법을 코드웍스의 블록코딩과 텍스트 코드를 통해 쉽게 설명해드리겠습니다. 특히 웹 스크래핑을 처음 시작하시는 분들도 쉽게 따라할 수 있도록 구성했으니, 함께 시작해볼까요? 😎1. requests 라이브러리  requests는 Python에서 HTTP 요청을 쉽게 보낼 수 있도록 설계된 사용하기 간단한 라이브러리입니다. 특히, 웹 스크래핑, 웹 API 통신, 웹 기반 데이터 자동화 등 다양한 영역에서 활용 될 수 있으며, 파이썬 개발자에게 필수적인 도구로 평가받고 있습니다.     2. req..
[넘파이 기초] numpy 배열 생성
·
📊 데이터 분석/🎲넘파이 numpy
안녕하세요 코드웍스입니다.이번시간에는 데이터분석을 할때 기본적으로 자주 사용되는 파이썬 라이브러리인 넘파이(numpy)를 이요해서 배열(array)을 생성하는 방법에 대해 다뤄보겠습니다. 😎넘파이(numpy)란?NumPy(Numerical Python)는 파이썬의 고성능 수치 계산을 위한 핵심 라이브러리입니다. 데이터 분석, 머신러닝, 과학 계산 등 다양한 분야에서 필수적으로 사용되는 도구로, 특히 대규모 배열과 행렬 연산을 효율적으로 처리할 수 있게 해줍니다. 왜 데이터분석에서 numpy가 사용될까? 🤔속도와 메모리 효율성: 데이터 분석에서는 큰 데이터를 다루는 일이 많기 때문에, 메모리와 속도가 중요한데, NumPy는 일반적인 Python 리스트보다 훨씬 빠르게 연산을 수행하고 메모리 효율이 뛰어..
[판다스 기초] DataFrame 정보 확인 방법 총정리
·
📊 데이터 분석/🐼 판다스 pandas
안녕하세요 코드웍스입니다.이번시간엔 판다스의 데이터프레임(dataframe)으로 데이터의 정보를 파악하는 함수들을 소개해드리려고합니다.pandas에서 데이터분석을 하기전, 데이터 정보를 확인하는 방법에 대한 내용이니 잘 알아두시면 좋을 것 같습니다. 😎 데이터프레임(Dataframe)이란?데이터프레임(dataframe)은 판다스(pandas) 라이브러리에서 제공하는 2차원 데이터 구조입니다.행과 열로 이루어진 표 형태의 데이터를 다루기 위해 사용됩니다.기본적인 데이터프레임의 생성에 대한 것은 이전 포스팅에서 보실 수 있습니다.[판다스 기초] 데이터프레임(dataframe)-생성&출력 [판다스 기초] 데이터프레임(dataframe)-생성&출력안녕하세요 코드웍스입니다!이번 시간에는 데이터 분석에서 많이 쓰..
[판다스 기초] 데이터프레임(dataframe) csv 파일 읽기 & 쓰기
·
📊 데이터 분석/🐼 판다스 pandas
안녕하세요 코드웍스입니다!이번 시간에는 코드웍스를 활용해서 판다스(pandas)  데이터프레임(dataframe)으로 csv파일을 읽어오고, 저장하는 방법을 알아보도록 하겠습니다.  1. csv 파일이란?Comma Seperated Value(csv)의 줄임말입니다.매우 단순한 텍스트 파일 형식으로, 데이터가 쉼표로 구분된 값들로 저장됩니다.데이터가 단순 텍스트로 저장되기 때문에 파일 크기가 매우 작고, 읽고 쓰는 속도가 빠릅니다.이제 판다스로 csv파일을 읽어오고 쓰는 방법을 소개해드리도록 하겠습니다.그전에, 판다스 데이터프레임의 행(row), 열(column), 인덱스(index)가 무엇을 의미하는지 설명하는 그림을 참고하시길 바랍니다.2. csv파일 읽기(read)판다스에서는 csv파일을 쉽게 읽어..
[판다스 기초] 데이터프레임(dataframe)-생성&출력
·
📊 데이터 분석/🐼 판다스 pandas
안녕하세요 코드웍스입니다!이번 시간에는 데이터 분석에서 많이 쓰이는 pandas의 dataframe(데이터프레임)을 코드웍스를 활용하여 배워보도록 하겠습니다.목차pandas란?판다스(pandas)는 파이썬에서 사용하는 데이터분석 라이브러리 입니다. 데이터분석, 조작, 시각화 등 다양한 기능을 제공합니다.pandas는 크게 두가지 데이터 구조를 제공하는데, series와 dataframe입니다.series: 1차원 데이터 구조dataframe: 2차원 데이터 구조, 행과 열로 구성된 표 형태의 데이터이번 시간에는 판다스의  데이터프레임(dataframe)에 대해서 자세히 알아보도록 하겠습니다.1. pandas 데이터프레임(dataframe) 기본 생성1.1 pandas import그럼 pandas를 사용하..