intro 빈도수 기반 표현은 단어 간 의미차를 표현할 수 없다. 단어-단어 거리를 계산해서 차이를 얘기하는 것이 어렵다. 유사도를 비교할 수는 있겠지만 논리적인 의미는 없다. 단지 컴퓨터에서 처리하기 적합한 자료 구조일 뿐이다. 단어 자체의 의미를 다차원 공간에서 벡터화 필요 단어들 사이의 유사도 측정 가능 단어들 간의 평균 및 연산을 통해 추론 가능 벡터의 연산 ex king - man + woman = queen 한국 - 서울 + 도쿄 = 일본 장점 : dimension도 엄청나게 줄일 수 있고, 단어 간 연산도 가능하다. Continuous Bag of Words (CBoW) 주변에 있는 단어들로 중간에 있는 단어들을 예측하는 방법이다. The fat cat (sat) on the mat. {'T..
Python
PyCharm 파이참에서 아나콘다, 가상환경 설정하기 PyCharm에서 프로젝트별 작업환경을 구분하여 작업하기 위해 미리 기본 설정이 조금 필요합니다. Anaconda는 미리 설치되어있다고 가정하고 파이참에서 Virtual Enviroment를 연동하는 방법을 알아보겠습니다. Setting - 아나콘다 환경으로 설정 파이참에서 Configure -> Settings 왼쪽에 설정할 프로젝트명 아래에 Project Interpreter로 들어갑니다. 오른쪽에 Project Interpreter 드롭메뉴에 설정할 가상환경이 없으면 오른쪽 톱니바퀴(설정) 버튼을 누릅니다. 뜬 팝업창에서 Project Interpreter -> Conda Environment -> New environment or Existin..
계산이 필요할 땐 list, 필요 없을 땐 tuple 사용 a,b=(7,3) #위 표현이 더 좋아보여 print(a) print(b) c=(7,3) print(c[0]) print(c[1]) 평균과 분산값 받아올 때 이런 식으로 mean, var = getdata(~) 만약 분산이 필요 없다면 이런 식으로 mean, _ = getdata(~)