• 제목/요약/키워드: 중심도로 추출

검색결과 443건 처리시간 0.037초

단어 임베딩(Word Embedding) 기법을 적용한 키워드 중심의 사회적 이슈 도출 연구: 장애인 관련 뉴스 기사를 중심으로 (A Study on the Deduction of Social Issues Applying Word Embedding: With an Empasis on News Articles related to the Disables)

  • 최가람;최성필
    • 정보관리학회지
    • /
    • 제35권1호
    • /
    • pp.231-250
    • /
    • 2018
  • 본 논문에서는 온라인 뉴스 기사에서 자동으로 추출된 키워드 집합을 활용하여 특정 시점에서의 세부 주제별 토픽을 추출하고 정형화하는 새로운 방법론을 제시한다. 이를 위해서, 우선 다량의 텍스트 집합에 존재하는 개별 단어들의 중요도를 측정할 수 있는 복수의 통계적 가중치 모델들에 대한 비교 실험을 통해 TF-IDF 모델을 선정하였고 이를 활용하여 주요 키워드 집합을 추출하였다. 또한 추출된 키워드들 간의 의미적 연관성을 효과적으로 계산하기 위해서 별도로 수집된 약 1,000,000건 규모의 뉴스 기사를 활용하여 단어 임베딩 벡터 집합을 구성하였다. 추출된 개별 키워드들은 임베딩 벡터 형태로 수치화되고 K-평균 알고리즘을 통해 클러스터링 된다. 최종적으로 도출된 각각의 키워드 군집에 대한 정성적인 심층 분석 결과, 대부분의 군집들이 레이블을 쉽게 부여할 수 있을 정도로 충분한 의미적 집중성을 가진 토픽들로 평가되었다.

빅데이터 클러스터링을 위한 K-Means 초기 중심 선정 연구 (A Study on Initial Seeds Selection of K-Means for Big Data Clustering)

  • 김영주;허유경;백종상;정환종;이성로;정민아
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.750-752
    • /
    • 2014
  • K-Means 알고리즘은 구현이 쉽고, 패턴수가 n일 때 시간 복잡도가 O(n)인 장점을 가져 대용량 데이터에서 널리 이용된다. 그러나, K-Means 알고리즘은 초기 클러스터 중심을 어떻게 선정하는가에 따라 할당-재계산 횟수, 클러스터링 결과를 결정짓는다. 본 논문에서는 K-Means 알고리즘에서 클러스터 초기 중심 선정 연구를 살펴보고 계통임의추출법을 적용하여 K-Means 초기 중심 선정 방법을 제안한다. 제안한 방법은 대용량 데이터의 클러스터링 시간을 감소하고 정확도를 향상시킬 수 있다.

문제 유형을 고려한 학습자 중심의 문제은행 시스템 설계 (A Design of Learner-oriented Item Bank System Considering Type of Content)

  • 오원욱;김용수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.558-561
    • /
    • 2009
  • 본 논문에서는 웹기반 문제은행의 발전된 모형으로 문제 유형에 따른 학습자의 맞춤형 문제를 제공하는 시스템을 설계하였다. 본 시스템의 최종 목표는 능동적, 자기 주도적 학습을 실현할 수 있는 맞춤형 이러닝을 통해 학습자의 학업 성취도 향상에 있다. 교수자 및 개발자 중심의 이러닝 서비스가 아닌 학습자의 학습 결과에 능동적으로 반영하고 유연한 서비스를 제공하기 위해 문제 유형에 따른 적합한 다음 단계의 문제를 제공함으로써 이러닝의 효율을 극대화 한다. 기존의 고정 출제 또는 무작위 출제 방식에서 탈피하여 개별 학습자의 오답과 문제 유형을 고려하여 문제의 키워드, 선택된 보기의 키워드, 유동적 난이도에 따른 문제 추출 방식을 설계하였다. 이 모델은 보조 학습의 수단으로 문제은행 시스템을 학습자 중심에 근접하여, 융통적이고 효과적으로 개인화된 서비스를 제공한다.

강우 사상의 시·공간적 규모 특성을 반영한 호우중심형 ARF 산정 (Estimation of Storm-centered ARF in the Context of Temporal and Spatial Scale Characteristics of Storm Events)

  • 김은지;강부식
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.181-181
    • /
    • 2018
  • 설계홍수량 산정 시 지점확률강우량을 대상유역 내 면적강우량으로 환산하기 위하여 면적우량 환산계수(areal reduction factor, ARF)를 적용한다. ARF 산정방법은 크게 면적고정형 방법과 호우중심형 방법으로 나뉜다. 면적고정형 방법은 현재 국내 하천설계기준에서 설계강우량 산정 시 활용하고 있는 방법이지만, 동 시간에 발생한 강우사상을 활용하지 않고 지점강우량과 면적강우량의 독립적인 빈도해석을 통해 산정되므로 비현실적인 값이라고 볼 수 있다. 본 연구에서는 강우사상의 공간분포 특성을 효과적으로 반영할 수 있는 레이더 강우 자료를 활용하여 한강권역의 호우중심형 ARF를 활용하였다. 호우중심형 ARF는 지속기간 1, 3, 6, 12, 24시간에 대하여 산정하였으며, 재현기간은 강우 사상의 규모에 따라 총 다섯 구간(0-10, 10-20, 20-50, 50-80, 80-100년)으로 분류하였다. 지속기간 및 재현기간에 따른 호우중심형 ARF는 강우 사상마다 산정되므로 다양한 값이 산재(scattered)되어 있는데, 대푯값을 선정하기 위하여 Weibull 분포의 비초과확률 95%의 값을 추출하였다. 두 가지 방법으로 산정된 ARF는 지속기간에 대하여 로그형태로 증가하였으나, 재현기간에 따른 관계에서는 차이를 보였다. 면적고정형 ARF는 재현기간에 대한 민감도가 매우 낮았으나, 호우중심형 ARF는 재현기간에 따라 감소하였다. 또한 호우중심형 ARF는 지속시간이 길수록 재현기간에 대한 민감도가 점차 낮아졌으며 지속기간 24시간 이후로는 일정한 값을 보였다. 이러한 차이는 레이더 실 강우를 활용한 호우중심형 ARF 산정 시에 면적고정형 ARF 산정과정에서 고려되지 않는 강우의 시 공간적 특성을 반영하기 때문인 것으로 사료된다. 따라서 설계홍수량 산정 시 호우중심형 ARF를 적용한다면 보다 현실적인 값을 제시할 수 있을 것으로 판단된다.

  • PDF

Development of Algorithm for Automatic Installation of Detection Area for Obtaining Traffic Information by Analyzing the Panning, Tilting Factors of CCTV Cameras on the Highway

  • Lee, In-Jung;Seong Namkoong;Min, Joon-Young;Yun, Byeong-Ju
    • 한국통신학회논문지
    • /
    • 제26권10B호
    • /
    • pp.1436-1443
    • /
    • 2001
  • 본 연구는 고속도로에 설치된 CCTV 카메라에서 교통량, 속도, 점유율 등의 교통정보를 수집하기 위하여 검지영역을 자동으로 설치하는 알고리즘을 제안한다. 이를 위하여 교통정보센터에 설치된 콘트롤러에서 CCTV 카메라의 Pan, Tilt, Zoom 요소값을 보내면 이 값만큼 CCTV 카메라가 panning, tilting이 되고, 이에 따른 변화된 영상이 교통정보센터로 전송이 된다. 기존의 연구로는 영상 내에서 도로를 추출하기 위하여 차 영상(difference image)에 의한 도로추출방법과 윤곽선 추출방법에 의한 도로추출 방법이 있으나, 전자는 도로를 추출하는데 있어서 시간이 많이 소요된다는 문제점이 있으며, 후자는 정확한 도로를 추출하지 못한다는 문제점이 있다. 이러한 문제를 해결하기 위하여 본 연구에서는 우선 각 차로 상의 직선의 방정식을 구하고, 이 직선의 방정식에서 CCTV 카메라가 Panning, Tilting하는 중심점을 찾은 다음 CCTV 카메라의 Pan, Tilt 값에 의하여 3차원상의 원근비율에 따라 각 차로 별 좌표변환방법을 이용한다. 본 연구를 위한 실험은 고속도로 기흥IC에 15m 높이로 설치된 CCTV 카메라에서 영상을 캡쳐하였으며, 차후 교통량, 속도, 점유율 등 교통정보를 산출하는데 처리 속도를 고려하여 영상의 해상도는 640480픽셀과 256명암값에서 계산되었다.

  • PDF

동적 시소러스와 GA을 이용한 개별화된 E-Mail1 분류시스템 (PECS) (Personalized I-Mail Classification System Using Dynamic Thesaurus and Genetic Algorithm)

  • 안희국;노희영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.472-474
    • /
    • 2002
  • 본 논문에서는 전자메일을 사용자 적합도(선호도)를 기준으로 분류하기 위한 구조를 제안한다. 분류는 1차 분류와 2차 분류로 나눠지는데, 1차 분류에서는 사용자 적합도를 판단하기 위해 사용자 관련 정보로부터 동적 시소러스를 구축하고, 구축된 시소러스와의 비교를 통해 사용자에게 유용한 메일인지 아닌지를 결정하고, 2차 분류에서는 사용자가 지정한 폴더키워드를 중심으로 사용자 시소러스로부터 유전자 알고리즘을 이용해 추출한 키워드들과의 적합도 비교를 통해서 특정 폴더로의 분류가 이뤄지게 된다 테스트에는 메일 정보값(Mail Information Word)을 추출하기 위해 HAM(Hangup Analysys Module)을 포함하는 메일정보추줄 에이전트를 사용하였고, mail의 subject와 본문(body)로부터 추출된 16개의 word정보와 시소러스 적합도 정보, 분류 적합도 정보를 하나의 데이터구조로 사용하였다. 이러한 통할된 시스템 구조와 data structure를 이용해 mail을 사용자의 선호도에 따라. 1차와 2차에 걸친 분류시 분류가 사용자 선호도에 근접하게 이루어 질 수 있음을 확인하였다.

  • PDF

홍채인식시스템 성능향상을 위한 유클리드 거리값과 멀티데이터 사용에 관한 연구 (A Study of The Use of Multidata and Euclidean Distance for The Robust Iris Recognition System)

  • 손진호;장자인;이일병
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.628-630
    • /
    • 2004
  • 홍채 인식 시스템은 영상 획득과 전처리, 특징 추출, 등록, 인증/증명의 다섯 단계로 나누어진다. 시스템의 성능 향상을 위해서는 모든 부분이 중요하나 본 논문에서는 특징 추출에 중심을 두고 양쪽 눈의 홍채 정보를 결합하여 실험하였다. 양쪽 눈의 홍채 정보를 결합했다 함은 영상 획득과 전처리를 거쳐 얻어진 양쪽 눈 영상에서 하위 90도 영역을 잘라 붙여서 홍채 영상을 만들고 그 데이터를 사용했음을 의미한다. 특징 추출에는 2단계의 wavelet transform을, 인식에는 유크리드 거리값을 사용하였다. 실험을 통해서 단일 홍채 시스템에 비해 향상된 결과를 얻을 수 있었다.

  • PDF

일차원 홍채 신호를 이용한 개인 식별 (Personal Identification Using One Dimension Iris Signals)

  • 박영규;노승인;윤훈주;김재희
    • 대한전자공학회논문지SP
    • /
    • 제39권1호
    • /
    • pp.70-76
    • /
    • 2002
  • 본 논문에서는 홍채 영역 가운데 .개인의 특징을 가장 잘 나타내는 부분을 선택하여 특징을 추출함으로써 최소한의 홍채 영역을 사용하는 빠른 개인 식별 알고리즘을 제안하였다. 제안 알고리즘은 먼저 흑백 CCD 카메라를 통하여 눈 영상을 획득하고, 최소 탐색 영역을 갖는 개선된 원형 에지 검출기(circular edge detector)에 의해 결정된 동공 및 홍채의 중심과 반지름을 이용하여 홍채 영역을 추출하였다. 그 다음으로 동공 중심과 홍채 중심 축 사이에서 원의 중심과 반지름을 변화시켜가면서 홍채 영역을 여러 개의 원으로 나누고 원주 상에 나타나는 일차원 홍채 신호들 가운데 개인의 특징을 가장 잘 반영하는 부분을 선택한 후 그 영역에 일차원 Gator 필터를 적용하여 홍채 특징을 추출하였다. 개인 식별은 등록 과정을 통해 미리 저장되어 있는 홍채 신호와 개인 식별을 위하여 입력된 홍채 신호 사이의 상관도(correlation) 값을 기준으로 이루어졌다. 판단을 위한 상관도에 대한 임계치 설정은 실험을 통하여 얻은 확률 분포를 이용하여 Type Ⅰ에 러율과 Type Ⅱ 에러율의 평균이 최소가 되는 점으로 결정하였다. 그 결과로 제안 시스템의 성능은 평균 에러율이 약 5.2%로 나타났다.

안동부 고지도의 유형별 수록지명 연구 (A Study on the Place-Names in Old Maps of Andong-Bu)

  • 배미애
    • 한국지역지리학회지
    • /
    • 제10권3호
    • /
    • pp.511-538
    • /
    • 2004
  • 지명은 특정 지역의 생활양식이나 고유한 지리적인 특성을 반영한 상징적 언어이다. 지도에 수록된 지명을 통하여 과거나 현재의 지역성과 역사적 연속성을 살펴볼 수 있다. 조선시대 안동대도호부를 그린 지도의 지명을 추출하여 과거 안동부의 지역성을 파악하고 이를 통하여 오늘날의 안동문화권을 이해하고자하는 것이 본 연구의 목적이다. 안동부 고지도의 자연지명을 통하여 산천을 신앙시하는 선조들의 사고를 엿볼 수 있다. 그리고 합리적인 행정을 위해 지도가 갖추어야 할 조건에 충실하여 방면 등 행정지명에 비중을 두었음을 알 수 있다. 봉수중심의 군사지명과 역원중심의 교통지명은 중앙과의 연계에서 안동부 사람들의 지역의 안위에 대한 인식과 영남내륙의 교통중심으로서 안동부의 위상을 설명해준다. 영남사림의 중심지역인 안동부는 삶의 근간을 이루는 중요한 사상으로서 유교를 중심축으로 하여 공간구성이 이루어졌으며 이는 안동부 고지도에 수록된 문화지명 속에 고스란히 반영되어 있다.

  • PDF

인맥 네트워크의 분석을 이용한 모바일 서비스에 관한 연구 (A Study on the Visualization of Human Network for Mobile Services)

  • 정겨운;김효동;이경원
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 2부
    • /
    • pp.389-395
    • /
    • 2006
  • 이 연구는 사회관계망의 형태와 구성원에 관한 정보를 분석하여 모바일로 서비스하는 것에 관한 연구이다. 사람들은 얽히고 설킨 다양한 인간 관계를 갖고 있다. 인간 관계를 유지하기 위해 여러 채널을 통해 커뮤니케이션을 하게 된다. 실생활에서 갖게 되는 인간 관계의 형태와 가장 비슷한 형태의 커뮤니케이션 채널은 휴대전화이다. 사회관계망 이론의 관점에서 보면 휴대전화의 사용은 기존의 인맥에서 친밀도가 적은 사람에게는 영향이 크지 않지만 친밀도가 높은 사람에게는 더욱 친밀하게 만드는 영향을 준다. 이 연구에서는 휴대전화의 통화상대, 통화시간, 통화량 등의 정보가 나타나있는 통화기록에 기반하여 일정기간 동안 통화한 상대들을 추출하였다. 통화기록의 정보를 사회 관계망 분석 도구인 UCINET으로 분석한 결과 휴대전화를 매개로 한 사회관계망의 형태가 자아 중심적 관계망과 같은 형태를 지니고 있다는 사실을 도출해냈다. 그리고 자아 중심적 관계망의 분석 기법을 이용하여 관계망의 중심에 있는 자아와 통화상대와의 관계를 분석하였다. 또한 통화상대들의 휴대전화 통화기록을 통해 서로 관계가 있는지에 대해 알아보았다. 그 결과 자아의 인맥 네트워크 안에 있는 사람들을 그룹화하고 그들의 나이, 성별, 직업에 의해 어떠한 특징을 갖는 그룹인지 분석하였다. 이러한 연구는 휴대전화를 통해 자신의 인간 관계 형태를 파악하여 관계를 관리하고 유지할 수 있는 새로운 모바일 서비스 개발을 위해 활용될 수 있을 것이다.

  • PDF