• 제목/요약/키워드: 웹 통계

검색결과 405건 처리시간 0.026초

Anchor Text의 단어 정보를 이용한 자동 문서 범주화 (Automatic Text Categorization Using Term Information of Anchor Text)

  • 허희근;한기덕;정성원;임성신;권혁철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.665-668
    • /
    • 2004
  • 최근의 웹 문서는 텍스트뿐만 아니라 이미지, 사운드 등 다른 여러 형태로 표현되고 있어서 텍스트의 비중이 낮아지고 있다. 그래서 문서 내에서 일정량 이상의 단어 추출이 어려운 문서들에 대해서 기존의 단어 정보만을 이용한 문서 범주화 방법은 좋은 성능을 기대할 수 없다. 그래서 본 논문은 Anchor Text 단어 정보의 자질 적합성 판단에 의한 새로운 자동 문서 범주화 모델을 제안한다. 문서 범주화 모델로는 베이지언 확률 모델을 이용하였으며, 카이제곱 통계량을 사용하여 자질을 선정하였다. 문서 내에서 추출된 단어 자질들이 해당 문서를 판단하는데 부족하다고 판단되면 문서의 링크정보를 이용하여 연결된 문서의 단어 자질과 Anchor Text의 단어 자질을 반영함으로써 성능을 향상시킨다.

  • PDF

통합 로그 분석 시스템을 위한 통계학적 예측 엔진 개발 (Development of Statistical Prediction Engine for Integrated Log Analysis Systems)

  • 고광만;권범철;김성철;이상준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.638-639
    • /
    • 2013
  • Anymon Plus(ver 3.0)은 통합 로그 분석 시스템으로 대용량 로그 및 빅데이터의 실시간 수집 저장 분석할 수 있는 제품(초당 40,000 이벤트 처리)으로서, 방화벽 로그 분석을 통한 비정상 네트워크 행위 탐지, 웹 로그 분석을 통한 사용 패턴 분석, 인터넷 쇼핑몰 사기 주문 분석 및 탐지, 내부 정부 유출 분석 및 탐지 등과 같은 다양한 분야로 응용이 확대되고 있다. 본 논문에서는 보안관련 인프라 로그를 분석하고 예측하여 예상 보안사고 시기에 집중적 경계를 통한 선제적 대응을 모색하기 위해 통계적 이론에 기반한 통합 로그 분석 시스템을 개발하기 위해, 회귀분석 및 시계열 분석이 가능한 예측 엔진 시스템을 설계하고 구현한다.

소셜 검색 향상을 위한 토픽별 인적속성의 영향력 산출 (Assessing Influence of Human Factors according to Topics for Enhancing Social Search)

  • 권오상;박건우;이상훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.142-145
    • /
    • 2010
  • 정보의 양이 폭발적으로 증가함에 따라 방대한 정보 속에서 사용자의 검색 의도에 맞는 정보를 효과적으로 제공하기란 매우 어려워졌다. 따라서 웹 사용자들의 요구사항을 충족시키기 위한 연구들이 활발히 수행되고 있으며, 많은 방법론들이 제시되고 있다. 본 논문에서는 회귀분석이라는 통계학적 기법을 통해 검색 토픽에 대한 사용자의 인적속성들이 미치는 영향력을 산출하였다. 이는 인간이 가진 내재적 특성이 토픽별 검색 성향과 어떠한 연관관계가 있는지를 규명한 것이다. 또한 특정 토픽에 대해 영향력이 높은 인적속성의 일치 여부가 해당 토픽에 대한 사용자 검색성향의 유사정도와 매우 큰 상관관계가 있는 것을 증명하였다. 이와 같은 사실을 기반으로 사용자가 특정 토픽에 대해 검색 시 해당 토픽에 대해 영향력이 높은 인적속성을 확인하고, 이 속성이 일치하는 사람들의 검색 정보를 제공한다면, 사용자는 보다 만족된 검색결과를 얻을 수 있을 것이다.

알레르기 관리 웹 사이트 개발 (Development of the Allergy Management Website)

  • 조규철;신예은
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
    • /
    • pp.157-160
    • /
    • 2021
  • 식품 알레르기의 발생 빈도는 전 세계적으로 증가 추세에 있으며 한국에서도 중요한 공중 보건 문제로 대두되고 있다. 현재 가장 확실하고 유일한 식품 알레르기 치료법은 원인 식품의 섭취를 철저하게 제한하는 것이다. 그러나, 이 방법으로 치료를 진행하게 되면 환자에게 삶의 질 감소와 영양 불균형이라는 악영향을 가져다 줄 수 있다. 본 연구에서는 사용자가 입력한 정보들을 바탕으로 알레르기 원인을 분석하고, 증상 발생 통계 및 안전한 제품 정보를 제공하는 시스템을 개발하였다. 알레르기 관리 시스템을 통해 사용자의 편의성을 도모할 수 있고 기록된 식단, 증상 데이터들은 향후 알레르기 치료에 참고될 중요한 자료가 될 것으로 기대된다.

  • PDF

사회적 핵심 이슈 키워드 정보를 활용한 채팅 프로그램 개발 (Development of chatting program using social issue keyword information)

  • 윤경섭;정원혁
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.307-310
    • /
    • 2020
  • 본 논문에서 이슈 키워드 추출을 위해 텍스트 마이닝(Text Mining) 기술을 요구한다. 사회적 이슈 키워드를 추출하기 위해 키워드 수집 모델이 되는 사이트에서 크롤링(crawling)을 수행한 뒤, 형태소 단위 의미있는 단어를 수집하기 위해 형태소 분석(morphological analysis)을 수행한다. 한국어 형태소 분석을 위해 파이썬의 코엔엘파이(KoNLPy) 패키지를 활용한다. 형태소 분석을 통해 나뉘어진 단어에서 통계를 내어 이슈 키워드 추출한다. 이슈 키워드를 뒷받침할 연관 단어를 분석하기 위해 단어 임베딩(Word Embedding)을 수행한다. 단어 임베딩 수행을 위해 Word2Vec 모델 중 Skip-Gram 방법론을 적용하여 연관 단어를 분석하도록 개발하였다. 웹 소켓(Web Socket) 통신을 통한 채팅 프로그램의 상단에 분석한 이슈 키워드와 연관 단어를 출력하도록 개발하였다.

  • PDF

기계 독해를 이용한 COVID-19 뉴스 도메인의 한국어 질의응답 챗봇 (Korean Q&A Chatbot for COVID-19 News Domains Using Machine Reading Comprehension)

  • 이태민;박기남;박정배;정영희;채정민;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.540-542
    • /
    • 2020
  • 코로나 19와 관련한 다양한 정보 확인 욕구를 충족하기 위해 한국어 뉴스 데이터 기반의 질의응답 챗봇을 설계하고 구현하였다. BM25 기반의 문서 검색기, 사전 언어 모형인 KoBERT 기반의 문서 독해기, 정답 생성기의 세 가지 모듈을 중심으로 시스템을 설계하였다. 뉴스, 위키, 통계 정보를 수집하여 웹 기반의 챗봇 인터페이스로 질의응답이 가능하도록 구현하였다. 구현 결과는 http://demo.tmkor.com:36200/mrcv2 페이지에서 접근 및 사용을 할 수 있다.

  • PDF

인공지능 기반 전력 수요 예측 방법에 관한 고찰 -앙상블 및 회귀 알고리즘을 기반으로- (A Study on AI-Based Electricity Demand Forecasting - Focusing on Ensemble and Regression Methods-)

  • 김윤명;윤주영;김민주;채기웅;최유정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.857-859
    • /
    • 2022
  • 본 연구는 인공지능 기반의 전력 수요 데이터 예측 모델을 구축하고 이를 최종적으로 웹의 형태로 구현하는 것을 목표로 하였다. 기상청 데이터의 기후 요소를 매개변수로 삼아 전력 수요를 예측하고, 그 결과를 가시적으로 시각화하는 것까지의 전 과정을 최대한 간결하게 진행하였다. 추후 한층 더 발전된 모델을 구축할 수 있다면, 전력시장의 효율성과 경제성을 향상시켜 불필요한 에너지 낭비를 미연에 방지할 수 있을 것이라고 기대한다. 나아가 시스템 상용화를 위해 계속 연구 활동에 정진할 수 있을 것이다.

방사선종양학과 On-line 통계처리프로그램의 개발 (The Development of On-Line Statistics Program for Radiation Oncology)

  • 김윤종;이동훈;지영훈;이동한;조철구;김미숙;류성렬;홍승홍
    • Radiation Oncology Journal
    • /
    • 제19권4호
    • /
    • pp.369-380
    • /
    • 2001
  • 목적 : 인터넷을 이용한 국내 방사선종양학과내의 관련정보를 공유할 수 있는 통계처리프로그램을 개발함으로써 방사선 종양학의 발전을 위한 정책적 판단의 기초자료를 제공하고자 한다. 대상 및 방법 : 전국 52개 병원을 대상으로 방사선 종양학과내의 관련정보를 지면을 이용한 설문조사를 통해 통계 처리하던 기존 방식에서, 인터넷을 이용하여 입력한 후 필요한 정보에 대한 전국 통계를 실시간으로 얻을 수 있도록 구성하였다. 통계조사를 위한 서버 환경으로 O/S는 Windows NT 4.0을 기반으로 하였으며 웹서버로는 Internet Information Server 4.0 (IIS4.0)을 이용하였다. 자료를 수집하고 검색하기 위한 데이터베이스로는 $Microsoft^{\circledR}$사의 Access MDB를 사용하였고 데이터베이스를 사용자가 접근하고, 활용하기 위한 실제 프로그램은 Structured Query Language (SQL), Visual Basic, VBScript, JAVAScript 등을 이용하여 구현하였다. 입력된 자료는 사용자의 요구에 따라 연도별, 병원별로 통계처리 되어 표시되도록 하였다. 결과 : 프로그램은 크게 나누어 인력현황, 연구현황, 특수증기 및 특수기술 등을 요하는 치료현황, 외부조사기기에 따른 치료현황, 근접치료현황, 임상통계현황, 방사선 안전관리현황, 시설현황, 장비현황, 방사선 정도관리현황 및 방사성 핵종 보유현황으로 구성되어 있다. 세부항목은 총 38개의 입력창으로 구성되어 있으며, 통계 처리한 결과는 6개의 출력창을 통하여 보여주고 있다. 또한 사용자의 요구에 따라 통계처리결과는 유연하게 확장이 가능하게 되어 있다. 결론 : 전국 방사선 종양학과내에서 이루어지고 있는 모든 자료에 대할 통계 자동화 프로그램을 개발하여 기초자료로 활용할 수 있도록 하였다. 이를 통하여 관련 사용자들이 쉽고 빠르게 자료를 입력할 수 있고, 또 전국적인 통계자료 정보를 필요에 따라 수시로 얻을 수 있게 되었다.

  • PDF

소셜커머스 서비스품질과 서비스제공 업체의 물리적환경이 소셜커머스 충성도에 미치는 영향 -공동구매형 소셜커머스를 중심으로- (A Study on the Effect of Social Commerce Service Quality and Service Provider Physical Environment on the Social Commerce Loyalty -Focused on the Social Commerce for Group Purchase-)

  • 최태호;윤대홍;옥정원
    • 한국산학기술학회논문지
    • /
    • 제17권11호
    • /
    • pp.322-331
    • /
    • 2016
  • 본 연구는 소셜커머스 서비스품질과 서비스제공 업체의 물리적환경이 소셜커머스 신뢰 및 서비스제공 업체 만족을 통한 소셜커머스 충성도에 미치는 영향에 관한연구로, 가설검증결과는 다음과 같다. 첫 번째, 소셜커머스 서비스품질과 소셜커머스 신뢰와의 관계는 정보성(가설 1-1), 상호작용성(1-3)이 소셜커머스 신뢰에 통계적으로 유의한 결과를 미치는 것으로 나타났으며, 거래성(가설 1-2), 웹디자인(가설 1-4), 보안성(가설 1-5)은 통계적으로 유의하지 않는 것으로 나타났다. 두 번째, 서비스제공 업체 물리적환경과 서비스제공 업체 만족과의 관계는 청결성(가설 2-2), 분위기(가설 2-3), 상호작용성(3-5)이 서비스제공업체 만족에 통계적으로 유의한 결과를 미치는 것으로 나타났으며, 편리성(가설 2-1), 유용성(가설 2-4)은 통계적으로 유의하지 않는 것으로 나타났다. 마지막으로 소셜커머스의 신뢰와 서비스제공업체 만족과 소셜커머스 충성도간의 관계(가설 3, 4, 5)는 모두 통계적으로 유의한 결과를 미치는 것으로 나타났다. 본 연구의 결과는 공동구매형 소셜커머스에 대한 종합적인 이해와 함께 공동구매형 소셜커머스 및 서비스제공 업체의 활성화를 위한 전략의 수립에도 중요한 시사점을 제공할 것으로 기대된다.

R을 활용한 '대화형 통계학 입문 실습실' 개발과 활용 (Interactive Statistics Laboratory using R and Sage)

  • 이상구;이긍희;최용석;이재화;이지영
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제29권4호
    • /
    • pp.573-588
    • /
    • 2015
  • 본 연구에서는 최근 통계 분야에서 활용도가 급격히 높아지고 있는 중요한 컴퓨터 언어이자 오픈 소스 통계 프로그램인 R을 활용하는 '대화형(interactive) 통계학 입문 실습실'의 개발 과정과 내용 및 활용을 다룬다. 최근에 개발을 마치고 2014 서울 세계수학자대회에서 소개된 후, 통계 강좌 등에 실제 사용되는 웹상의 R을 활용한 본 대화형 통계학 입문 실습실의 특징은 웹상에서 본문과 예제의 설명 및 풀이과정과 함께 대응하는 R 명령어 코드들을 함께 박스안에 제공하여, 실습 때마다 일일이 컴퓨터 명령어 코드들을 입력해야하는 번거로움을 없앴다. 또한, 명령어의 실행을 위하여 프로그램을 설치하지 않고, 명령어 상자 아래 제공한 [클릭-실행] 버튼을 누르기만 하면, 클라우드 컴퓨팅으로 그 결과값과 그래픽을 동시에 바로 같은 화면에서 확인하면서, 시뮬레이션 및 실습을 할 수 있고, 더 나아가 그와 유사한 다른 문제에 함수와 조건만을 수정하여 바로 사용할 수 있는 편리함이 추가되었다. 그 결과 대화형 통계학 입문 실습실에서는 R 명령어를 이해하는 데 필요한 시간과 노력이 대폭 줄어들 뿐 아니라, 초보자에게 통계학 입문 과목을 지도하기에 적절하며, 그밖에 다양한 Java 시각화 도구와 이미지 및 통계 자료를 사용하여 사용자 맞춤형 강의실 개발이 가능하여 통계학입문 강의를 수강하는 학생들의 관심과 흥미를 유도할 수 있도록 하였다. 본 연구에서는 본 실습실을 통계입문 강좌의 효과적인 실습실 모델의 하나로 소개한다.