일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- docker
- 백준
- dataframe
- 알고리즘
- disjoint set
- 파이썬
- 포트앤어댑터 아키텍처
- Redis
- UML
- equals
- 세그먼트 트리
- 다익스트라
- springboot
- 데이터 flow
- 이펙티브 자바
- 문자열
- spring security
- pandas
- ddd
- 위상정렬
- dfs
- DP
- 비트마스크
- JPA
- BFS
- series
- 스프링
- 자바
- 헥사고날 아키텍처
- java
- Today
- Total
목록머신러닝,마이닝 (5)
코딩못하는사람
1.2 핵심 기능 1.2.1 reindex 재색인 Series객체에 대해서 reindex를 호출하면 데이터를 새로운 색인데 맞게 재배열하고 존재하지 않는 색 이 있다면 NaN을 추가 obj = pd.Series([4.5, 7.2, -5.3, 3.6], index=['d', 'b', 'a', 'c']) obj2 = obj.reindex(['a', 'b', 'c', 'd', 'e']) #원하는순으로 출력한 것 a -5.3 b 7.2 c 3.6 d 4.5 e NaN #e는 없었으므로 method='ffill'을 추가하면 여 누락된 값(NaN)을 직전의 값으로 채워 넣을 수 있다 칼럼과 인덱스 둘다 reindex가 가능하다. 1.2.2 하나의 로우나 컬럼 삭제 하기 drop 메서들를 사용하여 선택한 값들이 삭제..
1.1 pandas 자료구조 1.1.1Data Series obj2 = pd.Series([4, 7, -5, 3], index=['d', 'b', 'a', 'c']) (인덱스 선언을 하지않으면 0부터 차례대로 설정됨) obj d 4 b 7 a -5 c 3 dtype: int64 obj.index와 obj.values로 인덱스 모음과 값들을 볼 수 있음. inedx=Index(['d', 'b', 'a', 'c'], dtype='object') values=[ 4 7 -5 3] 1차원 데이터이므로 인덱스에 접근해서 데이터를 사용할 수 있다. obj2['d'] = 6 values=[6,7,-5,3] Series는 고정길이의 정렬된 사전형 색인값에 데이터 값을 매핑 하고 있기때문에, 파이썬의 사전형과 비슷하다...
4주차 과제하며 배우고 익힌것. 1.np.random np.random에서 크게 3가지가 있다. np.random.randint [최저값, 최대값)의 범위에서 임의의 정수를 만든다. Score = np.random.randint(100, size=(10, 4)) (0~99점까지 숫자를 10행 4열 짜리 사이즈로 만들어라) np.random.rand(size) 만들어진 난수 어레이는 주어진 값에 의해 결정되며, [0, 1) 범위에서 균일한 분포를 갖는다. np.random.rand(5) >>>[0.41626628 0.40269923 0.80574938 0.67014962 0.47630372] np.random.rand(2, 3) >>>[[0.83739956 0.62462355 0.66043459] [0.9..
Supervised Learning (지도학습) Linear Regression (예측) Binary Classification (이진 분류) Multi-label Classification (다중 분류) Linear Regression (선형 회귀분석) Cost function (Loss Function) 예측을 하는 값과 실제 결과 값의 차이를 나타내는 함수이다. 예측을 하는 데이터를 바꾸어가면서 실제 결과 값과 차이를 그래프로 나타낼 수 있다. 제일 적절한 예측을 하는 가설은 바로 cost function이 최소가 되는 가설일 것이다 경사 하강법 sklearn LinearRegression 사용법 from sklearn.linear_model import LinearRegression을 통하여 싸이..
1 NumPy 기본: 배열과 벡터 연산 Numpy 에서 제공하는 것 • 효율적인 다차원 배열인 ndarray는 빠른 배열 계산과 유연한 브로드캐스팅 기능 제공 • 반복문을 작성할 필요 없이 전체 데이터 배열을 빠르게 계산 할 수 있는 표준 수학함수 • 배열 데이터를 디스크에 쓰거나 읽을 수 있는 도구와 메모리에 적재된 파일을 다루는 도구 • 선형대수, 난수 생성기, 퓨리에 변환 기능 데이터 분석 에서 중요하게 생각하는 기능 • 벡터 배열 상에서 데이터 가공, 정제 , 부분집합, 필터링 변형 그리고 다른 여러 종류의 연산을 빠르게 수행 • 정렬, 유일 원소 찾기, 집한 연산 같은 일방적인 배열 처리 알고리즘 • 통계의 효과적인 표현과 데이터를 수집 요약하기 • 다양한 종류의 데이터를 병합하고 역끼 위한 데..