AI(70)
-
비트코인 가격 예측 모델
Regression 모델로 예측 data loading import pandas as pd dataset = pd.read_csv('bitcoin.csv')dataset.head() Date Open High Low Close Adj Close Volume 0 2017-01-01 963.66 1003.08 958.70 998.33 998.33 147775008 1 2017-01-02 998.62 1031.39 996.70 1021.75 1021.75 222184992 2 2017-01-03 1021.60 1044.08 1021.60 1043.84 1043.84 185168000 3 2017-01-04 1044.40 1159.42 1044.40 1154.73 1154.73 344945984 ..
2024.01.12 -
NumPy
사용 import numpy as np배열 선언 np.array N 차원 배열을 작성할 수 있음 1차원 배열, 2차원 배열, 3차원 배열처럼 원하는 차수의 배열을 만들 수 있음 1차원 배열은 vector 2차원 배열은 matrix vector와 행렬을 일반화한 것을 tensor라 함 x = np.array([1.0, 2.0, 3.0]) print(x)[1. 2. 3.]산술연산 x = np.array([1.0, 2.0, 3.0]) y = np.array([2.0, 4.0, 6.0]) x + yarray([3, 6, 9]) NumPy의 N차원 배열 A = np.array([[1, 2], [3, 4]]) print(A) [[1 2] [3 4]] A.shape (2, 2) A.dtype dtype('in..
2023.08.31 -
Keras로 MF 구현
평점 데이터로 rating matrix 생성 import pandas as pd import numpy as np from sklearn.utils import shuffle r_cols = ['user_id', 'movie_id', 'rating', 'timestamp'] ratings = pd.read_csv('u.data', names=r_cols, sep='\t',encoding='latin-1') ratings = ratings[['user_id', 'movie_id', 'rating']].astype(int) TRAIN_SIZE = 0.75 ratings = shuffle(ratings) cutoff = int(TRAIN_SIZE * len(ratings)) ratings_train = rat..
2022.05.15 -
Surprise
CF와 MF 기반 추천 시스템을 구현하고 test 할 수 있는 package surprise는 scikit package의 일부 설치 pip install scikit-surprise error: Microsoft Visual C++ 14.0 is required… 에러가 발생하면서 설치가 되지 않을 시, https://visualstudio.microsoft.com/ko/vs/community/ 에 방문하여 Visual Studio Community 2022를 download 한 후, 이를 설치합니다. 설치 시 수정을 누르고, 를 check 하여 설치한 후, PC를 reboot 해야 합니다. Anaconda 환경에서 설치하고자 할 때는, 다음과 같이 설치합니다. conda activate myenv c..
2022.05.15 -
Latent factor model: matrix factorization
Serious ^ | Amadeus The Color | purple | Avengers | | | Sens and | Ocean's Lethal Sensibility | 11 Weapon geard geared toward | toward females | males The lion king | The | Independence Princess | day Diary | v Dumb and Dummer Funny 모든 영화를 2가지 관점으로 분류 남성취향, 여성취향 or 진지한 영화, 재밌는 영화 영화를 벡터로 mapping Latent factor model: matrix factorization CF는 대표적인 '메모리 기반'의 추천 알고리즘이다. 반면에 Matrix Factorization은 '모델..
2022.05.15 -
데이터 마이닝 1
대용량 데이터에서 '중요한' 정보를 뽑아내고 의미있는 결과를 도출하는 절차를 '데이터 마이닝' 이라 한다. 혹은 데이터 안에서 자동으로 통계적 규칙이나 패턴을 찾는 것을 의미하기도 한다. 데이터 마이닝이 발전한 이유는 요즘 많은 테크 기업들이 적극적으로 도입하고 있는 '추천' 기술과 관련이 있다. 요즘과 같이 딥러닝을 이용한 추천 시스템 이전에는 머신 러닝 기법은 Factorialization Machine 등의 기법을 사용했으며 (Netflix), 그 이전에는 마켓-바스켓 모델이라던가, A-priori 알고리즘 등의 데이터 마이닝에서 다루는 알고리즘등이 사용되어 왔다. Market-basket model 어떤 제품 i를 구입했을 시 j라는 제품도 함께 살지 안 살지에 대한 것을 예측하는 모델이다. co..
2022.05.14