오늘은 파이썬에서 데이터를 다룰 때, 가장 많이 쓰이는 라이브러리 중 하나인 Numpy에 대해 배웠다.
Numpy란?
: 선형대수/통계 연산을 위한 라이브러리 (데이터는 행렬로 표현)
- 행렬 데이터 생성, 수정, 계산 등을 빠르게 처리해주는 패키지
- 선형대수학을 빠르게 연산
- 스칼라, 벡터, 매트릭스
- 머신러닝/딥러닝 연구에 필수적으로 사용
- 데이터 분석에서는 pandas가 많이 활용 되지만, 알고리즘 활용에 있어서는 numpy 패키지는 필수
0. Numpy 불러오기
# 라이브러리 불러오기
import numpy as np # numpy를 np로 줄여서 쓰겠다
1. array 생성
2. ndarray
- 한가지 데이터 타입만으로 사용이 가능
- 다른데이터 타입이 혼용되어 사용할 수 없다.
3. 데이터 수정
4. array broadcasting
- 차원이 다른 연산을 동일한 차원으로 자동으로 변경시켜 연산을 가능하게 해주는 것
5. array 조건 선택
5-1. 조건을 통한 데이터 변환
5-2. 조건에 맞는 값만 변경
6. 영 행렬(zero array) / 단위 행렬(one array)
6-1. 데이터 타입 확인 및 변경
- array.dtype : array 안의 데이터 타입을 확인할 때 사용하는 명령
7. 범위값 array 생성
- arange()
8. 행렬 덧셈
9. 행렬 곱(행렬의 내적 연산)
9-1. zip(*)
10. 행렬 데이터의 결합(concatenate)
- array 데이터 붙이기
11. Numpy modules
12. 통계 함수 사용
- max, min, mean(평균값), median(중앙값), var(분산), std(표준편차)
13. linspace, logspace
- linspace(시작, 끝, 나눌 구간) : 설정한 범위에서 선형적으로 분할한 위치의 값을 출력
- logspace(시작, 끝, 나눌 구간) : 설정한 범위에서 로그로 분할한 위치의 값을 출력
13.1.logspace
- log10(x1)=2, log_10(x_2) = 4
14. Random 모듈
- seed : 랜덤 규칙 설정값
- rand : 균등분포로 난수 생성
- randint : 균등분포로 정수 생성
- randn : 정규분포로 난수 생성
- shuffle : 무작위로 분포 섞기
- choice : 데이터를 특정 확률로 뽑기
14-1. seed
14-2. rand
14-3. randn
14-4. randint
14-5. shuffle
※ 해당 카테고리는 딥노이드, 오픈놀, 앙트비에서 주최하는 '<스타트업 유니버시티: DX Challenge 교육> AI+X 역량 강화 트랙'에 대한 기록입니다.
'[AI+X 역량 강화] 인공지능 > 1) 기본기: 파이썬, 데이터 수집' 카테고리의 다른 글
#9 데이터 수집 이론 및 활용 // 사례, 데이터3법, 비식별화 (1) | 2023.08.27 |
---|---|
#8 파이썬 기초 6 // Pandas 라이브러리 (0) | 2023.08.27 |
#6 파이썬 기초 4 // 클래스, 예외처리, 매직 메서드 (0) | 2023.08.26 |
#5 파이썬 기초 3 // 함수 문법 정리 (0) | 2023.08.25 |
#4 파이썬 기초 2 // 조건문, 반복문 (0) | 2023.08.25 |