'SPSS16.0'에 해당되는 글 1건

  1. 2008.06.04 SPSS 오픈하우스를 다녀와서...

사용자 삽입 이미지

SPSS 오픈 하우스를 다녀왔다. 오래전부터 SPSS KOREA에서 오픈 하우스를 진행하고 있는 것은 알았지만 참석은 처음이었다. SPSS 오픈하우스는 새롭게 발매 또는 개발된 통계프로그램(SPSS에서 개발된 SPSS의 새로운 버전이나나 클레멘타인 등)의 이론적 배경과 사용법을 강의하는 자리라고 할 수 있다. SPSS를 활용하는 실무자, 연구자의 입장에서는 새로운 방법론을 배울 수 있다는 장점이 있고, SPSS에서는 자사의 제품을 홍보하는 실익을 거둘 수 있어 판매자와 수용자가 서로 윈윈하는 성격을 가진다. 이러한 성격으로 인해 참석자들은 대부분 통계학 전공자이거나 데이터마이닝, CRM 실무자들, 리서치 회사들의 연구원들이 대다수다. 오늘도 통게학 교수님이나 리서치회사의 연구원, 모 게임회사의 리서치 담당자들이 참석했다.

개인적으로 통계학이나 SPSS는 대학원 시절에 학습한 기초적인 지식이 전부고 리서치 회사에 근무하면서는 최종적으로 얻고자 하는 결과물을 얻거나, 주요 문제를 검증하는 수단으로 사용했기 때문에 이론적 배경이 깊지는 않다. 왜 해당 결과물이 도출되었는지 학문적으로 설명하거나, 검증 결과가 타당한지 증명하는 것과 같이 통계 프로그램의 로직을 정확히 설명하는 부분과 관련해서는 아직도 많이 모자란다. 그렇기 때문에 다소 오늘 강의 내용을 전부 이해하는 것이 쉽지는 않았다.

하지만 현실적으로 나에게 필요한 지식은 원하는 결과물을 얻기 위해, 검증하기 위해 어떤 방법론을 사용할 수 있는지 파악하고, 결과물을 산출할 수 있는 것이기 때문에 심도 깊은 학문적 지식이 필수는 아니라고 생각한다.(물론 이론적 배경까지 튼실하게 받쳐준다면 다양한 형태로 응용하고 그것을 통해 조금 더 최적의 결과물을 얻을 수 있기는 하다)

오늘 소개된 주제는 PLS 회귀모형과 신경망모형의 2가지였다.
PLS 회귀모형은 기존 선형회귀모형의 문제점으로 지적되었던 다중공산성을 해결하고 굉장히 작은 관측케이스를 통해서도 결과를 얻어낼 수 있다는 점에서 회귀모형의 새로운 돌파구를 여는 모형이라고 생각된다.
신경망모형은 예측 모델링의 한 방법으로서 기존의 로직트리와는 다르게 인간의 뇌 신경망과 같은 로직으로 모델링을 수행할 수 있는 모형이라고 할 수 있다.
2가지 모형의 공통된 특징은 예측에 조금 더 포커스를 두고 있다는 공통점이 있다. 즉 선형회귀모형은 최종적인 종속변수에 영향을 미치는 독립변수와의 관계가 어떠한지에 중점을 두고 있다면 PLS는 회귀식 산출을 통해 독립변수에 따라 종속변수의 최종 값(결과물)이 무엇인지 예측하는데 조금더 적합한 모형이다.
신경망모형 또한 예측이라는 관점에서는 좋은 결과물을 얻을 수 있지만 기존의 로직트리나 로지스틱방법과는 다르게 왜 그러한 결과물이 도출되었는지에 대해서 설명하는데는 다소 한계점이 존재한다.

이 정도가 오늘 간략하게 이해한 2가지 모형의 핵심인듯 하다.

리서치 관련 업무를 수행하면서 항상 통계학과 수학에 대한 미련이 남는다. 그럼에도 여전히 현란한(?) 수식에 압도되어 원리를 공부하기 보다는 통계패키지의 힘을 빌리고 있다. 이론을 안다면 조금더 자유롭게 나의 가설을 입증할 수 있을텐데 말이다. 만일 리서치나 데이터마이닝에 뜻을 두고 있는 분들이 있다면 통계학과 수학의 기초 학문을 학습하는 것도 게을리하지 않았으면 한다. 실무를 수행하는데 통계패키지(SPSS나 SAS)를 다룰 수 있다면 큰 문제는 없을테지만 더 정확하고 자유도 높은 방법론을 사용하고 싶다면(이런 역량을 갖고 있는 사람이 희소하다) 더 큰 경쟁력을 갖기 때문이다.

Posted by honeybadger :