• 제목/요약/키워드: 코사인거리

검색결과 26건 처리시간 0.034초

BERT 레이어에 따른 동형이의어 의미 표현 비교 (Comparison of Homograph Meaning Representation according to BERT's layers)

  • 강일민;최용석;이공주
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.161-164
    • /
    • 2019
  • 본 논문은 BERT 모델을 이용하여 동형이의어의 단어 표현(Word Representation) 차이에 대한 실험을 한다. BERT 모델은 Transformer 모델의 인코더 부분을 사용하여 양방향을 고려한 단어 예측과 문장 수준의 이해를 얻을 수 있는 모델이다. 실험은 동형이의어에 해당되는 단어의 임베딩으로 군집화를 수행하고 이를 Purity와 NMI 점수로 계산하였다. 또한 각 단어 임베딩 사이를 코사인거리(Cosine Distance)로 계산하고 t-SNE를 통해 계층에 따른 변화를 시각화하였다. 군집된 결과는 모델의 중간 계층에서 점수가 가장 높았으며, 코사인거리는 8계층까지는 증가하고 11계층에서 급격히 값이 변하는 것을 확인할 수 있었다.

  • PDF

유사도 통합에 관한 연구 (A Study on Integrating Similarities)

  • 김선경;박지수;손진곤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.53-56
    • /
    • 2020
  • 유사도는 두 객체의 비슷한 정도를 실수로 나타낸 것이며 반대 개념인 다른 정도를 나타내는 것을 거리라 한다. 실세계에서 정확히 같은 것은 존재하기 힘들기 때문에 많은 응용 분야에서 유사도나 거리를 이용한다. 거리 중 대표적인 것으로 유클리드 공간에서 두 점 사이의 직선거리이다. 이 거리를 유클리드 거리라고 한다. 코사인 유사도는 벡터 공간에서 두 벡터 사이각의 코사인 값이다. 이외에도 용도에 따라 다양한 거리 또는 유사도가 연구되고 있다. 수학적으로 유사도는 이변수 함수로 나타낸다. 앞선 연구에서 민코프스키는 맨하탄 거리, 유클리드 거리 등을 매개변수 p를 이용하여 하나의 식으로 통합하였다. 이러한 유사도 통합은 유사도에 대한 새로운 통찰력을 제공하고 또 다른 응용을 제공한다. 본 논문은 기존 유사도의 의미를 개관하고 추가적인 매개변수를 도입하여 민코프스키 거리와 코사인 유사도를 통합한 식을 제시한다.

다해상도 신호해석을 이용한 음성개선 방식 비교 (comparison of Speech Enhancement Methods Using Multiresolutional Signal Analysis)

  • 한미경;석종원배건성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1998년도 추계종합학술대회 논문집
    • /
    • pp.1251-1254
    • /
    • 1998
  • 본 논문에서는 최근들어 널리 연구되고 있는 다해상도 신호해석 방법인 웨이브렛 변환, 웨이브렛 패킷, 그리고 코사인 패킷 알고리듬을 음성개선에 이용하여 각각의 성능을 비교하였으며, 또한 이를 기존의 스펙트럼차감법의 성능과 비교 분석 하였다. 성능비교의 척도로는 SNR과 ㅋ스트랄 거리를 이용하였다. 실험결과 SNR면에서는 코사인 패킷이 가장 좋은 결과를 보였다. 그리고 ㅋ스트랄 거리의 경우 코사인 패킷과 웨이브렛 패켓이 훨씬 나은 결과를 보였으며 주관적인 청취결과 역시 코사인 패킷이 가장 좋은 결과를 보였고, 기존의 스펙트럼 차감법은 musical noise의 영향으로 인해 상대적으로 다른 방식에 비해 합성음의 음질이 많이 떨어짐을 확인할 수 있었다.

  • PDF

다해상도 신호해석 방법을 이용한 음성개선 (Speech Enhancement Using Multiresolutional Signal Analysis Methods)

  • 석종원;한미경;배건성
    • 전자공학회논문지S
    • /
    • 제36S권7호
    • /
    • pp.134-135
    • /
    • 1999
  • 본 논문에서는 최근에 널리 연구되고 잇는 다해상도 신호해석 방법인 웨이브렛 변환, 웨이브렛 패킷, 그리고 코사인 패킷 알고리듬을 잡음음성의 음질개선에 이용하여 각각의 성능을 비교하였으며, 또한 이를 기존의 스펙트럼 차감법의 성능과 비교 분석하였다. 성능비교의 척도로는 SNR과 켑스트럼 거리를 이용하였다. 실험결과 SNR면에서는 코사인 패킷이 가장 좋은 결과를 보였고 켑스트럼 거리의 경우 코사인 패킷과 웨이브렛 패킷이 훨씬 나은 결과를 보였다. 주관적인 청취결과 역시 코사인 패킷이 가장 좋은 결과를 보였으며, 기존의 스펙트럼 차감법은 musical noise의 영향으로 인해 상대적으로 다른 방식에 비해 합성음의 음질이 많이 떨어짐을 확인할 수 있었다.

  • PDF

실감체험 증강현실 스마트 앱에서 피사체 거리 계산 정확성 연구 (A Study on Distance Accuracy in the Realistic Augmented Reality Smart App.)

  • 김영상;김휴찬
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1378-1381
    • /
    • 2013
  • 가상현실 체험형 콘텐츠는 컴퓨터를 이용하여 만들어낸 가공의 상황이나 환경을 사람의 감각 기관을 통해 느끼게 하여 사용자가 몰입감을 느끼고 상호작용하게 하는 기술이다. 본 연구에서는 스마트폰에서 LBS, Push 기술을 활용하여 증강현실 및 실감체험 기능이 있는 앱 실행 시 사용자 의도에 따른 콘텐츠 제공이 매치되기 위한 방안을 제안하였다. 그 예로 임의의 관광지에서 실제 피사체와 피사체를 비추는 스마트폰 카메라 화면속의 이미지가 일치되었을 때 카메라와 피사체간의 거리를 정확히 계산하는 방법으로 코사인 법칙 및 카메라 초점거리를 이용한 거리계산 방법을 제시하였다.

수중 음향 통신에 있어서 변형된 파형 정형 필터의 성능 평가 (Performance evaluation of a modified waveform shaping filter for the underwater acoustic communication)

  • 박규칠;정현수;박지현
    • 한국음향학회지
    • /
    • 제38권1호
    • /
    • pp.114-119
    • /
    • 2019
  • 천해에서 전송되어진 음향 신호는 해수면 및 바닥과 같은 경계로부터의 다중 반사파에 의해 많은 영향을 받는다. 경계로부터의 매우 큰 반사 신호는 심볼 간 간섭을 일으켜 수중 음향 통신의 성능을 저하시키는 요인이 된다. 일반적으로 이러한 종류의 음향 채널에서 반사된 신호를 방지하기 위해 파형 정형 필터를 사용되고 있다. 특히 상승 코사인 필터가 널리 사용되며, 이 필터는 전송 신호의 대역폭을 제한하는 데에도 사용된다. 본 연구에서는 천해에서 영상 데이터 전송을 위한 상승 코사인 필터를 평가하며, 이를 바탕으로 새로운 수정된 상승 코사인 필터를 제안하고 평가 하였다. 수중 음향 통신 시뮬레이션에 사용된 통신 시스템은 직교 위상천이변조(Quadrature Phase Shift Keying, QPSK) 시스템이고, 송수신 거리와 심볼율을 달리하여 수행한 결과, 최저 1.0 %에서 최고 32 %의 에러 감소율을 보였다.

반도체 식각 전산모사에 적합한 플럭스 생성 조건 (A Appropriate Flux Generating Conditions for Semiconductor Etching Simulation)

  • 정승한;권오봉;신성식
    • 전자공학회논문지
    • /
    • 제52권3호
    • /
    • pp.105-115
    • /
    • 2015
  • 반도체 식각 전산모사에서는 플라즈마 입자를 생성하는 소스의 모델링이 필요하다. 본 논문에서는 플라즈마 식각 공정에서 사용하는 소스를 확률분포함수로 모델링하고, 몬테칼를로 방법을 이용하여 특정 프로프일의 플럭스를 계산하는 실험을 하였다. 소스의 모델링 파라미터로 소스와 셀 사이의 거리, 소스에서 방사하는 입자수가 있고, 플럭스 계산에 미치는 추가적인 파라미터로 프로파일 상의 셀의 수(셀의 면적)이 있다. 방사하는 입자 분포는 사용하는 소스의 물성에 따라 가우시안 분포와 코사인 분포로 모델링 할 수 있는데, 본 논문은 이들 각각에 대하여 파라미터를 바꿔가며 전산모사를 한 결과를 보인다. 오차율은 가우지안(Incident Flux)과 코사인분포(Incident Neutral Flux)에서 모두 입자 수의 증가에 따라 상당부분 감소하였으나 처리시간은 이보다 더 증가하였다. 셀수와 거리의 증가는 오차율을 약간 증가시켰고 처리시간도 증가시켰다. 본 논문의 실험 결과를 통해 처리 시간을 고려하여 적합한 플럭스의 계산을 유추할 수 있다.

효과적인 웹 문서 변경도 측정 방법 (An Effective Metric for Measuring the Degree of Web Page Changes)

  • 권신영;김성진;이상호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권5호
    • /
    • pp.437-447
    • /
    • 2007
  • 다양한 유사도 측정 방법들이 웹 문서의 변경도 측정에 사용되어 왔다. 본 논문은 여섯 가지 웹 문서 변경 종류에 근거하여 변경도 측정 방법의 효과성 평가 척도를 정의하고, 새로운 유사도 측정 방법을 제안한다. 실제 웹 문서들과 인위적 문서들을 사용하여, 기존의 다섯 가지 측정 방법들(바이트 비교, TF IDF 코사인 거리, 단어 거리, 편집 거리, 슁글링)과 제안된 측정 방법을 비교 평가한다. 실험 결과 분석을 통해 제안된 측정 방법이 웹 문서의 변경 측정에 효과적임을 보인다. 본 연구는 웹 문서의 변화 정보를 필요로 하는 웹 응용 분야에서 웹 문서 변경도 측정 방법의 적합한 선택을 위한 지침이 될 수 있다.

한글 저자명 군집화를 위한 계층적 기법 비교 (Exploration of Hierarchical Techniques for Clustering Korean Author Names)

  • 강인수
    • 정보관리연구
    • /
    • 제40권2호
    • /
    • pp.95-115
    • /
    • 2009
  • 저자식별은 학술문헌에 출현한 동명저자명들을 실세계의 서로 다른 사람들로 대응시키는 것이다. 이를 위해 임의의 동명저자명쌍의 유사도를 계산하고 이를 바탕으로 동명저자명 개체들을 군집화하는 단계를 거친다. 저자명의 군집화 기법으로 주로 계층적 군집법이 사용되었으나 다양한 계층적 군집법에 대한 비교 평가는 미흡했다. 이 연구는 다이스계수, 코사인유사도, 유클리디안 거리, 자카드계수, 피어슨 상관계수 등의 다양한 개체거리/유사도수식과 계층적 군집법들의 상관관계와 계층적 군집기법들의 한글 저자식별 성능에 대한 비교/분석을 다룬다.

코사인 법칙과 3차원 좌표 변환을 이용한 단사진의 후방교회법 (Single Photo Resection Using Cosine Law and Three-dimensional Coordinate Transformation)

  • 홍송표;최한승;김의명
    • 한국측량학회지
    • /
    • 제37권3호
    • /
    • pp.189-198
    • /
    • 2019
  • 사진측량에서 단사진의 후방교회법은 이미 알고 있는 카메라의 내부표정요소, 지상좌표, 사진좌표를 이용하여 촬영당시 카메라의 위치와 자세에 해당하는 외부표정요소를 결정하는 방법이다. 본 연구에서는 코사인 법칙과 선형식기반의 3차원 좌표변환식을 이용하여 카메라의 외부표정요소를 결정할 수 있는 단사진의 공간후방교회법 알고리즘을 제안하였다. 제안한 알고리즘은 먼저 렌즈왜곡이 보정된 정규좌표를 코사인 법칙을 이용하여 지상좌표와 이에 대응되는 정규좌표간의 축척을 계산하였다. 그리고 나서 축척을 고려한 정규좌표와 지상좌표를 이용하는 선형방정식 기반의 3차원 좌표변환식을 적용하여 외부표정요소를 결정하였다. 제안한 알고리즘은 비선형방정식으로 편미분이 필요하나 지상좌표의 조합 중 가장 긴 거리를 구하여 각 지상좌표에 나누는 방법을 이용하여 초기값에 민감하지 않은 장점이 있었다. 또한, 세 점을 이용하여도 외부표정요소를 결정할 수 있기 때문에 기준점의 기하학적 배치에 안정적인 장점이 있었다.