큐:
새로운 머신 러닝 기능으로 재무 데이터에 대한 재고 문서를 채굴 할 수있는 방법은 무엇입니까?
ㅏ:머신 러닝과 AI의 흥미로운 신개념 중 하나는 과학자와 엔지니어가 완전히 새로운 유형의 리소스를 사용하여 주식 이동 및 투자 결과를 예측하는 다양한 방법을 시작하고 있다는 것입니다. 이것은 금융 세계에서 엄청난 게임 체인저이며 매우 심오한 방식으로 투자 전략에 혁명을 일으킬 것입니다.
이러한 유형의 주식 연구를 확장하기위한 기본 아이디어 중 하나는 자연 언어 모델링을 포함하는 계산 언어학입니다. 전문가들은 주식 분석을 확대하거나 미세 조정하거나 완전히 새로운 분석을 개발하기 위해 SEC 제출에서 주주 서한, 기타 주변 텍스트 기반 리소스에 이르기까지 텍스트 문서를 사용하는 방법을 조사하고 있습니다.
무료 다운로드 : 기계 학습 및 중요한 이유 |
중요한 면책 조항은 신경망, 기계 학습 및 자연어 분석의 새로운 진보를 통해서만이 모든 것이 실현 가능하다는 것입니다. ML / AI가 등장하기 전에 컴퓨팅 기술은 대부분 선형 프로그래밍을 사용하여 입력을 "판독"했습니다. 텍스트 문서가 너무 구조화되어 유용하지 않았습니다. 그러나 지난 몇 년 동안 자연어 분석의 발전으로 과학자들은 정량 가능한 결과 또는 다른 방식으로 계산할 수있는 결과를 위해 자연어를 "마이닝"하는 것이 가능하다는 것을 발견했습니다.
이에 대한 최고의 증거와 가장 유용한 예는 웹에서 구할 수있는 다양한 논문과 박사 과정에서 비롯된 것입니다. Lili Gao는 2016 년 4 월에 발간 된 "금융 경제학에서 기계 학습 및 전산 언어학 응용 프로그램"이라는 논문에서 기업 SEC 제출, 주주 통화 및 소셜 미디어 메시지의 채굴과 관련된 관련 프로세스를 적절하게 설명합니다.
"구조화되지 않은 고차원 텍스트 데이터에서 의미있는 신호를 추출하는 것은 쉬운 일이 아닙니다"라고 Gao는 말합니다. "그러나 머신 러닝 및 컴퓨터 언어 기술의 개발로 텍스트 문서 작업을 처리하고 통계적으로 분석 할 수 있으며 사회 과학에서 통계 텍스트 분석의 많은 응용 프로그램이 성공적으로 입증되었습니다." Gao의 모델링 및 캘리브레이션에 대한 논의에서 개발 된 전체 문서는 이러한 유형의 분석 중 일부가 어떻게 작동하는지 보여줍니다.
활성 프로젝트의 다른 소스로는이 GitHub 프로젝트 개요와 같은 페이지와 "Twitter 감정 분석"에서 중요한 재무 정보를 얻는 방법에 대한 IEEE 리소스가 있습니다.
결론적으로, 이러한 새로운 NLP 모델의 사용은 재무 분석뿐만 아니라 다른 종류의 최첨단 발견을 위해 모든 종류의 텍스트 문서를 사용함에있어 빠른 혁신을 주도하고 있으며, 전통적으로 "언어"와 "데이터."