• 제목/요약/키워드: 코사인

검색결과 350건 처리시간 0.025초

준 실시간 뉴스 이슈 분석을 위한 계층적·점증적 군집화 (Hierarchical and Incremental Clustering for Semi Real-time Issue Analysis on News Articles)

  • 김호용;이승우;장홍준;서동민
    • 한국콘텐츠학회논문지
    • /
    • 제20권6호
    • /
    • pp.556-578
    • /
    • 2020
  • 실시간으로 발생하는 뉴스 기사로부터 이슈를 분석하기 위한 다양한 연구가 진행되어 왔다. 하지만 범주에 따라 계층적으로 이슈를 분석하는 연구는 많이 진행되지 않았고, 계층적 이슈 분석을 위한 기존의 연구에서 제안하는 방식 또한 뉴스 기사 증가에 따라 군집화 속도가 느려지는 문제점이 있다. 따라서 본 논문에서는 준 실시간으로 뉴스 기사의 이슈를 분석하는 계층적·점증적 군집화 방식을 제안한다. 제안하는 군집화 방식은 샴 신경망을 이용한 가중 코사인 유사도 측정 모델 기반의 k-평균 알고리즘을 이용한 단어 군집 기반 문서 표현 방식을 통해 뉴스 기사를 문서 벡터로 표현한다. 그리고 문서 벡터로부터 초기 이슈 군집 트리를 생성하고, 새로 발생한 뉴스 기사를 해당 이슈 군집 트리에 추가하는 점증적 군집화 방식을 제안함으로써 뉴스 기사의 계층적 이슈를 준 실시간으로 분석한다. 마지막으로, 본 논문에서 제안하는 방식과 기존 방식들과의 성능평가를 통해 제안하는 군집화 방식이 정확도 측면에서 기존 방식 대비 NMI 지표 기준 0.26 정도 성능이 향상되었고, 속도 측면에서 약 10배 이상의 성능이 향상됨을 입증하였다.

빅데이터 검색 정확도에 미치는 다양한 측정 방법 기반 검색 기법의 효과 (Impact of Diverse Document-evaluation Measure-based Searching Methods in Big Data Search Accuracy)

  • 김지영;한다현;김종권
    • 정보과학회 논문지
    • /
    • 제44권5호
    • /
    • pp.553-558
    • /
    • 2017
  • 빅데이터의 공급이 늘어남에 따라, 이로부터 유용한 정보를 추출해내기 위한 학계와 업계의 연구가 활발히 진행 되고 있다. 특히 분석한 정보의 특징과 함께, 정보 검색 시 검색자의 의도를 함께 반영하여 정보를 여과해 주는 것이 대부분의 연구의 최종 목표이다. 정확하게 분석된 자료는 기업이 제공하는 서비스에 대한 사용자의 충성도를 높여주고, 사용자 스스로 보다 효율적이고 효과적으로 정보를 이용할 수 있게 된다. 본 논문에서는 가장 높은 빈도로 사용되는 검색 분야인 기사를 검색하는 경우의 정확도를 높이기 위해, 관련 데이터를 TF-IDF, 결정 트리, 코사인 유사도, 단순 베이지안 분류기 등의 다양한 측도방법으로 평가해 보고, 이를 분석하였다. 또한, 분석 결과를 바탕으로 가장 적합한 측도 방법을 제안한다.

모터의 성능향상을 위한 마그네틱 센서의 3차원 전자장 해석 (3D Electromagnetic Analysis of Magnetic Sensor for Improvement of Motor)

  • 심상오;김기찬
    • 한국산학기술학회논문지
    • /
    • 제14권5호
    • /
    • pp.2381-2387
    • /
    • 2013
  • 본 논문에서는 전동기의 속도 센서로 사용되는 마그네틱 센서의 3차원 전자장 해석 기술 및 분석 방법에 대하여 논하였다. 마그네틱 센서는 레졸버 및 엔코더와 같은 속도센서에 비해 가격이 싸고 활용성이 높은 장점이 있는 반면, 정밀도가 낮으며 외부 자기장에 대하여 간섭을 많이 받는 단점이 존재한다. 마그네틱 센서는 전동기가 회전할 때 사인과 코사인 파형이 발생된다. 그러나 홀 소자 근처에서의 자기적 노이즈로 인하여 사인 및 코사인 신호가 왜곡이 발생하여 각도 오차로 나타난다. 본 논문에서는 마그네틱 센서의 홀 소자의 적절한 위치 선정과 주위에 적절한 요크를 다꾸찌 방법에 의해 최적 설계를 수행하여 이러한 왜곡을 방지하고자 하였다. 해석방법으로는 3차원 유한요소법을 이용하여 해석의 정밀도를 높였다.

분포유사도를 이용한 문헌클러스터링의 성능향상에 대한 연구 (Improving the Performance of Document Clustering with Distributional Similarities)

  • 이재윤
    • 정보관리학회지
    • /
    • 제24권4호
    • /
    • pp.267-283
    • /
    • 2007
  • 이 연구에서는 분포 유사도를 문헌 클러스터링에 적용하여 전통적인 코사인 유사도 공식을 대체할 수 있는 가능성을 모색해보았다. 대표적인 분포 유사도인 KL 다이버전스 공식을 변형한 Jansen-Shannon 다이버전스, 대칭적 스큐 다이버전스, 최소스큐 다이버전스의 세 가지 공식을 문헌 벡터에 적용하는 방안을 고안하였다. 분포 유사도를 적용한 문헌 클러스터링 성능을 검증하기 위해서 세 실험 집단을 대상으로 두 가지 실험을 준비하여 실행하였다. 첫 번째 문헌클러스터링실험에서는 최소스큐다이버전스가 코사인 유사도 뿐만 아니라 다른 다이버전스공식의 성능도 확연히 앞서는 뛰어난 성능을 보였다. 두번째 실험에서는 피어슨 상관계수를 이용하여1차 유사도 행렬로부터2차 분포 유사도를 산출하여 문헌 클러스터링을 수행하였다. 실험결과는 2차 분포 유사도가 전반적으로더 좋은 문헌 클러스터링성능을 보이는 것으로 나타났다. 문헌클러스터링에서 처리 시간과 분류 성능을 함께 고려한다면 이 연구에서 제안한 최소 스큐 다이버전스 공식을 사용하고, 분류 성능만 고려할 경우에는 2차 분포 유사도 방식을 사용하는 것이 바람직하다고 판단된다.

적응형 영상 워터마킹 알고리즘 개발 (Development of Adaptive Digital Image Watermarking Techniques)

  • 민준영
    • 한국정보처리학회논문지
    • /
    • 제6권4호
    • /
    • pp.1112-1119
    • /
    • 1999
  • 디지털 워터마킹(digital watermarking)이란 영상이나 비디오, 오디오, 텍스트 등의 저작물에 잘 식별되지 않는 표시를 삽입하여 저작권을 보호하는 방법으로 소유권자의 동의 없이 저작물을 배포, 복사되는 것을 방지하는 방법이다. 주파수 공간에서의 적응형(adaptive) 워터마킹 알고리즘을 제안한다. 본 논문에서는 워터마크를 삽입하기 위해서 사인(sin)함수와 코사인(cos)함수를 이용한 푸리에(Fourier) 급수전개를 이용하였다. 우선, 원 이미지를 주파수 영역을 변환한 다음 워터마크를 삽입할 위치를 저주파 대역으로 한정지어 결정하였으며, M 개의 파형을 가장 직교성(orthogonality)이 좋다고 하는 사인함수와 코사인함수를 이용하여 푸리에 급수 전개를 하였다. 이때, 사인과 코사인의 n 차 고조파는 Random Sequence를 발생하여 결정하였다. 제안한 알고리즘은 이와 같이 푸리에급수전개를 했을 때 각 항의 푸리에 계수를 산출하여 이 푸리에계수에 워터 마크를 삽입하였다. 실험결과 JPEG 압축, 블러링(Bluring), 노이즈 삽입 등의 이미지 왜곡에 대하여 워터마크 상관관계가 최소 0.5467에서 최대 0.9507까지의 견고성(robustness)을 보였다. 본 논문에서는 256$\times$256 크기의 8비트 256 명암값(gray-level)을 갖는 Lenna 이미지를 이용하였다.

  • PDF

군집 주제의 유의어와 유사도를 이용한 문서군집 향상 방법 (Enhancing Document Clustering Method using Synonym of Cluster Topic and Similarity)

  • 박선;김경준;이진석;이성로
    • 대한전자공학회논문지SP
    • /
    • 제48권5호
    • /
    • pp.30-38
    • /
    • 2011
  • 본 논문은 군집 주제의 유의어와 유사도를 이용하여 문서군집의 성능을 향상시키는 방법을 제안한다. 제안된 방법은 비음수 행렬분해의 의미특징을 이용하여 군집 주제(topic)의 용어들을 선택함으로서 문서 군집 집합의 내부구조를 잘 표현할 수 있으며, 군집 주제의 용어들에 워드넷의 유의어를 사용하여서 확장함으로써 문서를 용어집합(BOW, bag-of-words)으로 표현하는 문제를 해결할 수 있다. 또한 확장된 군집 주제의 용어와 문서집합에 코사인 유사도를 이용하여서 군집의 주제에 적합한 문서를 잘 군집하여서 성능을 높일 수 있다. 실험결과 제안방법을 적용한 문서군집방법이 다른 문서군집 방법에 비하여 좋은 성능을 보인다.

이웃 선정 조건에 따른 협력 필터링의 성능 향상 분석 (Analysis of Performance Improvement of Collaborative Filtering based on Neighbor Selection Criteria)

  • 이수정
    • 컴퓨터교육학회논문지
    • /
    • 제18권4호
    • /
    • pp.55-62
    • /
    • 2015
  • 협력 필터링을 통한 추천 시스템은 정보 검색 편의성을 제공함으로써 다방면에서 성공적으로 활용되어왔다. 유사도 측정은 추천인들의 범위를 결정하는 기준이 되기 때문에 이러한 시스템의 성능을 좌우하는 결정적 요소이다. 본 연구에서는 기존의 유사도 측정 공식에서 산출되는 유사도값의 분포를 분석하고, 유사도값과 공통평가항목수와의 관계를 조사하였다. 이를 통해 발견된 문제점을 보완하기 위하여 유사도값의 제한을 통하여 신뢰할 만한 추천인들을 선정하는 방법을 제시하였다. 실험 결과, 유사도의 상한값과 하한값을 동시에 제한하는 방법이 기존보다 월등한 성능 향상을 가져왔다. 특히 적은 수의 최인접이웃을 참조했을 때 두드러졌는데, 코사인 유사도에 대해서는 최대 0.047, 피어슨에 대해서는 최대 0.03의 추천 성능 향상을 보였다. 이 결과는 피어슨과 코사인 유사도를 이용하는 협력필터링 시스템에서 매우 높거나 낮은 유사도의 이웃의 평가 등급은 참조하지 않는 것이 바람직함을 암시한다.

다채널을 가진 기지국에서 코사인 제2법칙을 사용한 위치 추정 방법 (In Base-station with Multi-channels Using the Second Law of Cosines the Position Estimation Method)

  • 이현성;복영수;신혜정;박병우
    • 한국통신학회논문지
    • /
    • 제34권12B호
    • /
    • pp.1387-1398
    • /
    • 2009
  • 최근에 이동국(MS)위치에 대한 정확한 위치 추정이 많이 요구되고 있다. 하지만, 기존 방법을 사용한 위치 추정 방법에는 많은 문제를 가지고 있다. 기지국(BS)은 이동국(MS)에서 전파한 전파를 수신하여 시간 지연에 따른 거리를 측정하고, 이동국(MS)에 근접한 기지국(BS)들을 선택하여 기존의 삼각측정법을 사용하여 위치를 추정한다. 이 방법은 참 위치와 추정된 위치가 많은 오차를 보이고 있다. 본 논문은 이동국(MS)의 위치를 추정하기 위해서 주변 기지국(BS)들을 선택하는 방법과 코사인 제 2법칙을 사용하여 각도를 추정하여 이동국(MS)의 위치를 추정하는 방법을 제안한다. 시뮬레이션을 통해서 기존 방법과 제안한 방법의 비교 검토하여 제안한 방법의 우수성을 증명한다.

CDCTLMS를 이용한 변환평면 적응 필터링 (Transform Domain Adaptive Filtering with a Chirp Discrete Cosine Transform LMS)

  • 전창익;여송필;전광석;이진;김성환
    • 한국음향학회지
    • /
    • 제19권8호
    • /
    • pp.54-62
    • /
    • 2000
  • 적응 필터링 기법은 시간에 따라 신호의 통계적 특성이 변화한때 많이 응용되는 신호처리의 분야이다. 적응필터의 성능 평가는 보통 구조의 복잡도 (complexity), 수렴 속도 (convergence speed) 및 오조정 (misadjustment)을 가지고 평가한다. 적응 필터의 실시간 구현을 위해서는 구조가 간단해야 피고 수렴속도는 빨라야 한다. 본 연구에서는 수렴속도 향상을 위해 변환 평면에서의 적응 필터링 기법에 대해 제안하였다. 먼저 CZT (Chirp Z-Transform)의 주파수 확대해석하는 특성과 DCT (Discrete Cosine Transform)의 실수연산 특성을 모두 가지는 CDCT (Chirp Discrete Cosine Transform)을 제안하였고, 이를 이용한 CDCTLMS (Chirp Discrete Cosine Transform LMS)을 제안하였다. 제안된 방법은 기존의 NLMS (normalized least mean square)알고리즘과 대표적인 변환평면 적응 필터링 방법인 DCTLMS (discrete cosine transform LMS) 알고리즘과의 학습곡선 (loaming curve)의 비교를 통하여 우수함을 입증하였으며 실제 초음파 신호처리에의 응용을 보였다.

  • PDF

빅데이터 군집 분석을 이용한 학습성취도 예측 - 종단 연구를 중심으로 (Predicting Learning Achievement Using Big Data Cluster Analysis - Focusing on Longitudinal Study)

  • 고수정
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권9호
    • /
    • pp.1769-1778
    • /
    • 2018
  • 빅데이터를 활용한 가치가 증대됨에 따라서 기업 뿐 아니라 교육 분야에서도 빅데이터 분석 기술을 활용한 여러 연구가 진행되고 있다. 본 논문에서는 빅데이터 군집 분석을 이용하여 학습성취도를 종단적으로 예측하는 방법을 제안한다. 제안한 방법에서는 한국아동 청소년패널조사(KCYPS) 자료의 중학교 1학년 학생의 학습 습관 유형을 기반으로 학생들을 Kmeans 알고리즘을 이용하여 학습 습관이 비슷한 그룹으로 분류하고, 그룹의 특징을 추출한다. 다음으로, 이와 같이 추출한 그룹의 특징을 이용하여 테스트 집합의 중학교 1학년 학생을 코사인 유사도를 사용하여 비슷한 학습 습관을 갖는 그룹으로 분류한 후, 이웃을 선정하고 학습성취도를 예측하였다. 본 논문에서 제안한 방법은 중학교의 학습 습관이 대학 및 전공 만족도까지 밀접한 영향을 미쳐서 고등학교의 학습성취도 뿐만 아니라 대학 및 전공에 대한 만족도까지도 예측이 가능하다는 것을 증명하였다.