• Title/Summary/Keyword: 유사도 판별

Search Result 381, Processing Time 0.032 seconds

KoCheckGPT: Korean LLM written document detector (KoCheckGPT: 한국어 초거대언어모델 작성 글 판별기)

  • Myunghoon Kang;Jungseob Lee;Seungyoon Lee;Seongtae Hong;Jeongbae Park;Heuiseok, Lim
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.432-436
    • /
    • 2023
  • 초거대언어모델(LLM)의 도래에 따라 다양한 과업들이 도메인 관계 없이 제로샷으로 추론이 가능해짐에 따라서 LLM이 다양한 산업분야에 적용되고 있다. 대표적으로 ChatGPT와 GPT-4는 상용 API로 서비스를 제공하여 용이한 서비스 접근으로 다양한 이용층을 끌어들이고 있다. 그러나 현재 상용 API로 제공되고 있는 ChatGPT 및 GPT-4는 사용자의 대화 내역 데이터를 수집해 기업의 보안 문제를 야기할 수 있고 또한 생성된 결과물의 환각 문제로 인한 기업 문서의 신뢰성 저하를 초래할 수 있다. 특히 LLM 생성 글은 인간의 글과 유사한 수준으로 유창성을 확보한만큼 산업현장에서 LLM 작성 글이 판별되지 못할 경우 기업 활동에 큰 제약을 줄 수 있다. 그러나 현재 한국어 LLM 작성 글 탐지 서비스가 전무한 실정이다. 본 논문에서는 한국어 초거대언어모델 작성 글 판별기: KoCheckGPT 를 제안한다.KoCheckGPT는 산업현장에서 자주 사용되는 문어체, 개조식 글쓰기로 작성된 문서 도메인을 목표로 하여 글 전체와 문장 단위의 판별 정보를 결합하여 주어진 문서의 LLM 작성 여부를 효과적으로 판별한다. 다국어 LLM 작성 글 판별기 ZeroGPT와의 비교 실험 결과 KoCheckGPT는 우수한 한국어 LLM 작성 글 탐지 성능을 보였다.

  • PDF

무게 중심 기반 자기 구성 지도를 위한 간암 추출 및 분석

  • Jung, Kyung-Hoon;Jang, Do-Won;Kim, Kwang-Baek
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2007.11a
    • /
    • pp.520-529
    • /
    • 2007
  • 간암은 세계적으로 흔한 악성 종양에 속하지만 우리나라에서 간암은 위암, 폐암 다음으로 높은 사망률을 보이며 이러한 간암은 조기진단이 요구된다. 전문의는 간암의 진단을 위해 조영증강 CT영상을 이용하여 육안으로 간암을 판별하는데, 조영증강 CT영상을 이용한 진단은 주 종양의 진단에는 도움이 되지만 주 종양에서 주위 간 조직으로 전이된 간암들을 판별하는 것은 어려우며 실제로 시술 중에야 전이된 간암의 존재를 알 수 있다. 본 논문에서는 조영증강 CT영상을 이용하여 간과 주 종양을 자동으로 추출한 후, 미세하게 주 종양 주위로 전위된 간암들을 추출하는 방법을 제안하여 전문의를 보조할 수 있는 보조 전문가 시스템으로서의 유용성을 확인하고자한다. 조영증강 CT영상은 흉부에서 5mm간격으로 40 ${\sim}$ 50장정도로 촬영된다. 조영증강 CT영상을 이용하여 간 영역을 추출하기 위해서 간의 형태학적 정보 그리고 명암도와 명암의 분포도를 이용한 양자화 기법 등을 적용하여 추출하며 추출된 간 영역에서 간암의 후보 영역 추출은 간암의 명암도와 형태학적 특징 정보를 이용하여 추출한다. 본 논문에서는 간암의 추출을 위해 맵 상에 흩어져 분포되어 있는 유사 패턴들의 무게 중심을 찾아 하나의 패턴으로 그룹화 하는 개선된 SOM 알고리즘을 제안하여 간암 판별에 적용한 후, 기존의 SOM 알고리즘과 비교 분석한 결과. 본 논문에서 제안된 SOM 알고리즘을 적용한 간암 추출이 더 효율적임을 확인 할 수 있었으며, 전문의가 판별한 것과 비교 분석한 결과, 전문의를 보조할 수 있는 보조 전문가 시스템으로서의 가능성을 확인할 수 있었다.

  • PDF

An Empirical Study on Method for Discriminating the Screen Equivalence for Evaluating the Compatibility of Smartphone Apps on Different Resolutions. (상이한 해상도의 스마트폰의 앱 호환성을 위한 화면 동등성 평가 기법에 대한 실험적 연구)

  • Lee, Jeong-Uk;Kim, Tae-Yeon;Chae, Heung-Seok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.04a
    • /
    • pp.1401-1404
    • /
    • 2011
  • 다양한 사용자의 요구를 충족 시키기 위해서 스마트폰 제조사들은 상이한 해상도의 스마트폰을 출시하고 있지만, 이것은 스마트폰 앱의 호환성 문제를 일으킬 수 있다. 호환성 문제는 서로 다른 해상도를 가진 스마트폰에서 동일한 앱을 실행했을 경우에 그 결과가 다른 현상을 말한다. 스마트폰의 해상도 차이에 따른 앱호환성 문제는 앞으로 더욱 심각해질 것으로 예상된다. 이러한 앱의 호환성을 판별하기 위하여 GUI 기반의 테스트 기법이 고려될 수 있다. 특히 해상도가 다른 두 스마트폰에서 동일한 앱의 실행 결과 화면의 화면 동등성 평가는 매우 어렵다. 본 논문에서는 이 문제를 극복하기 위하여 해상도가 다른 스마트폰의 앱 호환성을 평가하기 위한 화면 동등성을 판별하는 프레임워크를 제안한다. 상이한 해상도의 상용 스마트폰을 대상으로 앱의 실행화면 동등성 평가를 위해 단순 비교 기법과 VDP 기법의 성능 비교를 위한 실험 결과를 소개한다. 실험에서는 상이한 해상도의 스마트폰에서 동일한 앱의 실행 화면을 바탕으로 단순 비교 기법과 VDP 기법의 동등성 판별 성능을 비교한다. 실험 결과 사람의 시각 체계와 유사한 인지 능력을 보이는 VDP 가 화면의 동등성을 비교적 정확하게 판별하였다.

염색염료 색도제거 미생물의 분리동정에 관한 연구

  • Nam, Yun-Gu;Gwon, Hyeok-Gu;Chu, Deok-Seong;Lee, Bong-Jun;Lee, Jang-Hun
    • Proceedings of the Korean Environmental Sciences Society Conference
    • /
    • 2006.05a
    • /
    • pp.361-362
    • /
    • 2006
  • HUE05-1는 Bjerkandera adusta와 87.7% 정도만이 유사도를 갖고 있는 다른 새로운 종의 색도제거능력이 있는 균주로 판별되었으며, RO 16, RB 19, RB 49, RY 145, AO 10, AV 43, AB 350, DB 106등의 8가지 염료에 대하여 우수한 색도제거효과를 보였다.

  • PDF

Pattern Matching Method for Multi-Pattern Holograms by PCA Transformation (PCA 변환에 의한 다중패턴 홀로그램의 패턴정합 방법)

  • Seo, Hye-Yeong;Park, Tae-Hyoung
    • Proceedings of the KIEE Conference
    • /
    • 2008.07a
    • /
    • pp.1805-1806
    • /
    • 2008
  • PCA변환에 의한 다중패턴 홀로그램의 패턴정합 방법을 제안하고자 한다. 본 논문에서는 다중패턴 홀로그램의 패턴정합과정에서 공간영역과 주파수영역에서의 PCA변환과정을 통해 패턴정합을 수행함으로써 두 영역간의 유사도결과를 비교한다. 기존의 CGH방법에 근거하여 주파수 변환을 적용하여 패턴이 생성되고, 이때 주파수영역에서의 패턴매칭시 두 영상간의 유사도판별을 보다 정확하게 하고자 PCA변환에 근거한 정합방법을 수행하고자 한다.

  • PDF

A system design for textile defect detection using pattern matching (패턴매칭을 이용한 섬유결함 검출시스템의 설계)

  • Kang, Hyunsoo;Kim, Jongjun;Song, Nagun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.474-477
    • /
    • 2010
  • 본 논문에서는 패턴인식을 이용한 의류의 결함을 자동으로 탐색하는 시스템을 설계하였다. 이는 히스토그램을 기반으로 하여 영상의 특징을 추출하고 템플릿 매칭을 이용해서 패턴을 추적하도록 하였스며, 또한, SSIM(Structural Similarity) Index를 통해 추적된 패턴과 원 패턴의 유사도를 HVS(Human Vision System)을 기준으로 하여 결함을 판별할수 있도록 하였다.

Potential Similarity Measuring For Partial Image Matching (부분 영상 매칭을 위한 잠재적 유사성 측정 기법)

  • 유채곤;이성환;최영수;김진용;황치정
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.491-493
    • /
    • 1999
  • 본 논문에서는 부분 영상 매칭을 위한 잠재적 유사성 측정 기법을 제안한다. 영상 매칭은 영상 DB 검색이나 컴퓨터 비전 분야에서 매우 중요한 기법이지만 아직까지는 적용되는 영상의 분야가 한정되어 있는 것이 현실이다. 영상 DB 검색의 경우 찾고자 하는 영상내의 물체를 정확하게 알고 있을 경우도 있지만, 영상의 일부분이나 원하는 영상과 원하지 않는 영상이 섞여 있는 것을 기준으로 영상을 검색할 경우도 발생한다. 본 논문에서는 두 개의 영상을 매칭할 경우, 각 영상에서 유사한 부분이 존재하는지 여부를 판별할 수 있는 잠재적 유사성, 측정 알고리즘을 제안한다. 제안된 방법은 영상이 부분 정보를 사용하며, 회전, 배경에 불변적이고, 영상 분할을 필요로 하지 않고, 잡음에 강하다. 제안된 방법에서는 매칭 속도를 높이기 위하여, 유사성을 계산하기 전에 영상 농도치 변이 계수를 사용하여 사전 필터링을 시도한다.

  • PDF

A Similarity Valuating System using The Pattern Matching (패턴매칭을 이용한 유사도 비교 분석)

  • Ko, Bang-Won;Kim, Young-Chul
    • Journal of the Korea Society of Computer and Information
    • /
    • v.15 no.1
    • /
    • pp.185-192
    • /
    • 2010
  • This research suggests that valuate similarities by using the matches of patterns which is appeared on different two documents. Statistical ways such as fingerprint method are mainly used for evaluate similarities of existing documents. However, this method has a problem of accuracy for the high similarity which is occurred when many similar words are appeared from two irrelevant documents. These issues are caused by simple comparing of statistical parameters of two documents. But the method using patterns suggested on this research solved those problems because it judges similarity by searching same patterns. This method has a defect, however, that takes long time to search patterns, but this research introduce the algorithms complement this defect.

Calculation of a Threshold for Decision of Similar Features in Different Spatial Data Sets (이종의 공간 데이터 셋에서 매칭 객체 판별을 위한 임계값 산출)

  • Kim, Jiyoung;Huh, Yong;Yu, Kiyun;Kim, Jung Ok
    • Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography
    • /
    • v.31 no.1
    • /
    • pp.23-28
    • /
    • 2013
  • The process of a feature matching for two different spatial data sets is similar to the process of classification as a binary class such as matching or non-matching. In this paper, we calculated a threshold by applying an equal error rate (EER) which is widely used in biometrics that classification is a main topic into spatial data sets. In a process of discriminating what's a matching or what's not, a precision and a recall is changed and a trade-off appears between these indexes because the number of matching pairs is changed when a threshold is changed progressively. This trade-off point is EER, that is, threshold. To the result of applying this method into training data, a threshold is estimated at 0.802 of a value of shape similarity. By applying the estimated threshold into test data, F-measure that is a evaluation index of matching method is highly value, 0.940. Therefore we confirmed that an accurate threshold is calculated by EER without person intervention and this is appropriate to matching different spatial data sets.

Analysis of Genetic Diversity and Identification of Domestic Bred Phalaenopsis Varieties Using SRAP and SSR Markers (SRAP과 SSR 마커를 이용한 국내 육성 팔레놉시스 품종의 유전적 다양성 분석과 품종판별)

  • Park, Pue Hee;Park, Yong-Jin;Kim, Mi Seon;Lee, Young Ran;Park, Pil Man;Lee, Dong Soo;Yae, Byeong Woo
    • Horticultural Science & Technology
    • /
    • v.31 no.3
    • /
    • pp.337-343
    • /
    • 2013
  • The aims of this study were to compare genetic distances among 14 Phalaenopsis varieties using simple sequence repeat (SSR) and sequence-related amplified polymorphism (SRAP) marker systems and to determine the discrimination using SSR. A total of 111 SSR primers and 30 SRAP combinations were initially screened. Twelve SSR primers and thirty SRAP combinations showed high polymorphism among the 14 Phalaenopsis varieties including domestic breeding varieties, conserved in National Institute of Horticultural & Herbal Science (NIHHS). The amplified DNA fragments were separated by denaturing acrylamide gels and detected by silver staining method. A total of 474 polymorphic bands, including 55 by SSRs and 419 by SRAPs, were identified and used for genetic diversity analysis. Polymorphic bands were scored for calculating a simple matching coefficient of genetic similarity and cluster analysis with multi-variate statistical package (MVSP) 3.1. Fourteen Phalaenopsis varieties were classified into three major groups at similarity coefficient value of 0.683 and 0.66 using SRAP and SSR, respectively. Also we could discriminate these domestic breeding Palaenopsis varieties using only SSR 20 and SSR 22. The results indicate that SSR analysis is effective for discrimination among Phalaenopsis varieties and SRAP is useful for genetic diversity when there is no sequence information. These studied SSR and SRAP markers will be useful tools for genotype identification, germplasm conservation and genetic relationship study in Phalaenopsis.