본문 바로가기
[AI+X 역량 강화] 인공지능/1) 기본기: 파이썬, 데이터 수집

#7 파이썬 기초 5 // Numpy 라이브러리

by 'here' 2023. 8. 27.

오늘은 파이썬에서 데이터를 다룰 때, 가장 많이 쓰이는 라이브러리 중 하나인 Numpy에 대해 배웠다.


Numpy란?

: 선형대수/통계 연산을 위한 라이브러리 (데이터는 행렬로 표현)

  • 행렬 데이터 생성, 수정, 계산 등을 빠르게 처리해주는 패키지
  • 선형대수학을 빠르게 연산
    • 스칼라, 벡터, 매트릭스
  • 머신러닝/딥러닝 연구에 필수적으로 사용
  • 데이터 분석에서는 pandas가 많이 활용 되지만, 알고리즘 활용에 있어서는 numpy 패키지는 필수

0. Numpy 불러오기

# 라이브러리 불러오기
import numpy as np    # numpy를 np로 줄여서 쓰겠다

1. array 생성

2. ndarray

  • 한가지 데이터 타입만으로 사용이 가능
    • 다른데이터 타입이 혼용되어 사용할 수 없다.

3. 데이터 수정

4. array broadcasting

  • 차원이 다른 연산을 동일한 차원으로 자동으로 변경시켜 연산을 가능하게 해주는 것

5. array 조건 선택

5-1. 조건을 통한 데이터 변환

5-2. 조건에 맞는 값만 변경

6. 영 행렬(zero array) / 단위 행렬(one array)

6-1. 데이터 타입 확인 및 변경

  • array.dtype : array 안의 데이터 타입을 확인할 때 사용하는 명령

7. 범위값 array 생성

  • arange()

8. 행렬 덧셈

9. 행렬 곱(행렬의 내적 연산)

9-1. zip(*)

10. 행렬 데이터의 결합(concatenate)

  • array 데이터 붙이기

11. Numpy modules

12. 통계 함수 사용

  • max, min, mean(평균값), median(중앙값), var(분산), std(표준편차)

13. linspace, logspace

  • linspace(시작, 끝, 나눌 구간) : 설정한 범위에서 선형적으로 분할한 위치의 값을 출력
  • logspace(시작, 끝, 나눌 구간) : 설정한 범위에서 로그로 분할한 위치의 값을 출력

13.1.logspace

  • log10(x1)=2, log_10(x_2) = 4

14. Random 모듈

  • seed : 랜덤 규칙 설정값
  • rand : 균등분포로 난수 생성
  • randint : 균등분포로 정수 생성
  • randn : 정규분포로 난수 생성
  • shuffle : 무작위로 분포 섞기
  • choice : 데이터를 특정 확률로 뽑기

14-1. seed

14-2. rand

14-3. randn

14-4. randint

14-5. shuffle

 

 

 

※ 해당 카테고리는 딥노이드, 오픈놀, 앙트비에서 주최하는 '<스타트업 유니버시티: DX Challenge 교육> AI+X 역량 강화 트랙'에 대한 기록입니다.