통합 검색 | Korea Science

Prompting 기반 매개변수 효율적인 멀티 모달 영상 하이라이트 검출 연구 (Parameter-Efficient Multi-Modal Highlight Detection via Prompting)

한동훈;남성욱;박은환;곽노준
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
- /
- pp.372-376
- /
- 2023
본 연구에서는 비디오 하이라이트 검출 및 장면 추출을 위한 경량화된 모델인 Visual Context Learner (VCL)을 제안한다. 기존 연구에서는 매개변수가 고정된 CLIP을 비롯한 여러 피쳐 추출기에 학습 가능한 DETR과 같은 트랜스포머를 이어붙여서 학습을 한다. 하지만 본 연구는 경량화된 구조로 하이라이트 검출 성능을 개선시킬 수 있음을 보인다. 그리고 해당 형태로 장면 추출도 가능함을 보이며 장면 추출의 추가 연구 가능성을 시사한다. VCL은 매개변수가 고정된 CLIP에 학습가능한 프롬프트와 MLP로 하이라이트 검출과 장면 추출을 진행한다. 총 2,141개의 학습가능한 매개변수를 사용하여 하이라이트 검출의 HIT@1(>=Very Good) 성능을 기존 CLIP보다 2.71% 개선된 성능과 최소한의 장면 추출 성능을 보인다.
PDF

손 영역의 무게 중심과 퍼지 논리를 이용한 USB 카메라 기반의 지문자 인식 시스템 (USB Camera-Based Korean Manual Alphabet Recognition System Using Center of Gravity of Hand Region and Fuzzy Logic)

오영준;박광현;변증남
- 한국지능시스템학회:학술대회논문집
- /
- 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
- /
- pp.300-303
- /
- 2007
지문자는 청각장애인이 사용하는 수화로 표현하지 못하는 한글 문자를 알파벳으로 표시하기위한 손 제스처이다. 본 논문에서는 추출된 손 영역의 무게 중심과 퍼지 논리를 이용하여 지문자를 인식하는 알고리즘을 제안하고, 한글 문자를 표현하는 시스템을 개발한다. USB 카메라로부터 얻어진 영상에서 히스토그램을 이용하여 손의 피부색 영역을 추출하고, 영상 마스크를 이용하여 피부색이 아닌 배경 영역을 제거한다. 문턱 값을 사용하여 얻어진 이진화된 영상에서 손의 영역을 검출하고, 무게 중심을 이용하여 손 중심과 손가락 끝의 거리를 측정한다. 얻어진 거리 정보에 퍼지 기법을 적용하여 손가락의 굽힘 정도를 판단하고, 손 모양 데이터베이스에서 손가락 굽힘 정도와 가장 근사한 한글 문자를 선택한다.
PDF

한영 혼용문서 인식을 위한 다중 폰트 이미지로부터 한글과 영어의 구별 (Distinction of Korean and English Characters from Multi-font Images for the Recognition of Mixed Document Composed of Korean and English)

전일수
- 한국산업정보학회논문지
- /
- 제4권3호
- /
- pp.52-58
- /
- 1999
본 논문에서는 한\ulcorner영 혼용문서인식을 위해 다중 크기, 다중 활자체에 적용 가능한 한글과 영어를 구별하는 알고리즘을 제안한다. 제안된 방법에서는 글자의 종횡비, 연결요소의 수, 좌상단의 획이미지 존재 여부, 그리고 바(bar)를 입력 이미지에 대해 좌상우하의 순서로 진행해 가면서 바를 검출하고, 이들을 이용하여 한글과 영어를 구별한다. 제안된 방법을 문서 작성 시 널리 사용되는 ？글의 명조체, 신명조체, 고딕체, 궁서체에 대해 실험하여 그 성능의 우수성을 입증하였다.
PDF

한글 구조특성과 지역정렬 알고리즘을 사용한 표절 판정 시스템의 개발 (Plagiarised Reports Detection System using Characteristcs of Korean Language and Local alignment Algorithm)

전명재;박상돈;박웅;허진영;조환규
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
- /
- pp.727-729
- /
- 2004
최근 논문의 표절 및 저작권과 관련하여 여러 가지 사건들이 일어나 많은 관심과 우려를 불러일으키고 있다. 특히 인터넷 통신의 발달 및 워드프로세서의 기능 향상으로 인해 일선 교육현장에서의 표절에 간한 문제는 더욱 커지고 있다. 하지만 문서의 표절 여부를 가려내는 작업은 쉬운 일이 아니다. 과제로 제출되는 일반 문서의 경우 본문의 내용이나 문서의 개수를 고려해 볼 때 사람이 직접 표절 여부를 검사하는 것은 매우 힘든 작업이다. 그리고 어간, 어미의 변형이 쉽게 일어날 수 있는 한글의 경우에는 영어에서처럼 어절 단위로 두 문서를 비교하여 표절여부를 판정하는 기존의 방법은 적합하지가 않다 본 논문에서는 한글로 작성된 텍스트 문서의 표절 여부를 효과적으로 검출해 내기 위한 새로운 방법들을 제시하고 있다. 그리고 실제로 수집된 다양한 문서 데이터 집합들에 대해 각각의 방법들을 테스트해 보고 실제 데이터에서 가장 효율적인 방범이 어떤 깃인지 제시한다
PDF

조기 위험 검출을 위한 점진적 조기 텍스트 분류 시스템 (Incremental Early Text Classification system for Early Risk Detection)

배소현;이근배
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
- /
- pp.91-96
- /
- 2021
조기 위험 검출은 실시간으로 들어오는 텍스트를 순차적으로 처리하면서 해당 대화에 위험이 있는지 조기에 분류하는 작업으로, 정확도 저하를 최소화하는 동시에 가능한 한 빨리 대화를 분류하는 것을 목적으로 한다. 이러한, 조기 위험 검출은 온라인 그루밍 검출, 보이스 피싱 검출과 같은 다양한 영역에 활용될 수 있다. 이에, 본 논문에서는 조기 위험 검출 문제를 정의하고, 이를 평가할 수 있는 데이터 셋과 Latency F1 평가 지표를 소개한다. 또한, 점진적 문장 분류 모듈과 위험 검출 결정 모듈로 구성된 점진적 조기 텍스트 분류 시스템을 제안한다. 점진적 문장 분류 모듈은 이전 문장들에 대한 메모리 벡터와 현재 문장 벡터를 통해 현재까지의 대화를 분류한다. 위험 검출 결정 모듈은 softmax 분류 점수와 강화학습을 기반으로 하여 Read 또는 Stop 판단을 내린다. 결정 모듈이 Stop 판단을 내리면, 현재까지의 대화에 대한 분류 결과를 전체 대화의 분류 결과로 간주하고 작업을 종료한다. 해당 시스템은 micro F1과 Latency F1 지표 각각에서 0.9684와 0.8918로 높은 검출 정확성 및 검출 신속성을 달성하였다.
PDF

딥러닝에 의한 한글 필기체 교정 어플 구현 (An Implementation of Hangul Handwriting Correction Application Based on Deep Learning)

이재형;조민영;김진수
- 한국산업정보학회논문지
- /
- 제29권3호
- /
- pp.13-22
- /
- 2024
현재 디지털 기기의 확산과 함께 일상에서 손으로 쓰는 글씨의 비중은 점점 줄어들고 있다. 키보드와 터치스크린의 활용도 증가에 따라 한글 필기체의 품질 저하는 어린 학생부터 성인까지 넓은 범위의 한글 문서에서 관찰되고 있다. 그러나 한글 필기체는 여전히 개인적인 고유한 특징을 포함하면서 가독성을 제공하는 많은 문서 작성에 필요하다. 이를 위해 본 논문에서는 손으로 쓴 한글 필기체의 품질을 개선하고, 교정하기 위한 목적의 어플 구현을 목적으로 한다. 제안된 어플은 CRAFT(Character-Region Awareness For Text Detection) 모델을 사용하여 필기체 영역을 검출하고, 딥러닝으로서 VGG-Feature-Extraction 모델을 사용하여 필기체의 특징을 학습한다. 이때 사용자가 작성한 한글 필기체의 음절 단위로 신뢰도를 인식률로 제시하고, 또한, 후보 폰트들중에서 가장 유사한 글자체를 추천하도록 구현한다. 다양한 실험을 통해 제안한 어플은 기존의 상용화된 문자 인식 소프트웨어와 비교할만한 우수한 인식률을 제공함을 확인할 수 있다.
https://doi.org/10.9723/jksiis.2024.29.3.013 인용 PDF

대화 상태 추적 모델을 활용한 공황 장애 점진적 조기 위험 검출 시스템 (Incremental Early Risk Detection using Dialogue State Tracking for Panic Disorder)

이채빈;이근배
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
- /
- pp.497-501
- /
- 2022
대화 상태 추적(Dialogue State Tracking)은 특정 목적을 달성하기 위한 대화 시스템인 목적 지향 대화 시스템의 핵심 부분으로, 대화에서 표현된 사용자의 목적을 추출한다. 조기 위험 검출 시스템은 연속적으로 들어오는 정보를 바탕으로 분류 대상인지 아닌지를 판별하며, 정확도 저하를 피하면서 최대한 빠르게 분류하는 것을 목표로 한다. 본 연구에서는 대화 상태 추적 시스템에서 나온 은닉층을 입력으로 하여 실시간으로 공황 장애 여부를 점진적으로 조기 분류하는 시스템과 조기 분류를 위한 새로운 손실 함수를 제안한다. 조기 위험 검출 시스템에 대화 상태인 belief state의 정보를 함께 사용했을 때, 큰 성능 향상을 보였으며 대화 상태가 조기 위험 검출에 필요한 정보를 담고 있음을 확인할 수 있다.
PDF

임의 영상내 다수 객체에서 달력을 인식하기 위한 시스템의 구성 (The structure of the system for recognizing some calendars in an image.)

이광호;이승수;최운종;박장춘
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
- /
- pp.559-561
- /
- 2000
본 논문은 문자 인식의 기법을 이용하여 임의 영상에서 우리의 일상 생활에서 접하는 일반적인 달력을 포함하는 영상만을 검출하기 위한 영상 인식에 관한 연구이다. 달력이라는 영상내의 객체를 인식하기 위한 과정은 다음과 같이 요약된다. 우선 1~31까지의 숫자, 월요일(MON)과 같이 한글과 영문으로 된 요일, 월, 년과 같이 달력에 존재하는 아주 기본적인 문자에 대한 참조 패턴을 형성한다. 입력된 영상에서는 문자 영역 검출 단계, 문자의 특징 추출 단계를 거쳐 영상의 문자 추출이 이루어지고, 달력을 검출하기 위한 참조패턴과 입력 패턴의 비교를 수행하는 인식 단계를 거쳐, 영상 내의 달력 유무를 판단한다. 특히 불규칙적인 배열을 이루는 문자영역을 추출하기 위하여, 본 논문에서는 Hough Transform을 이용하여 기존의 규칙적 문자 인식의 문자 검출 방법의 한계점을 해결하였다.
PDF

내용기반 검색을 위한 비디오텍스트 검출 (Videotext Detection for Content-based Retrieval)

곽동엽;김은이;장재식;김항준
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2001년도 추계학술발표논문집 (상)
- /
- pp.805-808
- /
- 2001
본 논문은 비디오 영상에서 내용 기반 검색을 위한 비디오 텍스트를 검출하는 방법을 제안한다. 영어와 달리 한글과 같이 다중 분할된 문자가 포함된 비디오 텍스트를 자동으로 검출하기 위해 형태와 크기 및 위치 정보를 이용하고 이러한 정보들은 K-mean 클러스트링 알고리즘을 이용해 얻어진 템플릿의 형태로 표현 된다. 연결 성분 분석(connected component analysis)방법을 통해 비디오 영상을 분할하고, 잡음을 제거한 후 정확한 문자 성분을 검출하기 위해 클러스터 기반의 템플릿 매칭을 한다. 제안된 방법은 정확도와 에러율에서 기존의 방법보다 효과적 이었다.
PDF

패러프레이즈 문장 검출을 위한 양방향 트랜스포머 모델 구축 (Construction of a Bidirectional Transformer Model for Paraphrasing Detection)

고보원;최호진
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
- /
- pp.465-469
- /
- 2019
자연어 처리를 위해서 두 문장의 의미 유사성을 분석하는 것은 아주 중요하다. 이 논문은 패러프레이즈 검출 태스크를 수행하기 위한 Paraphrase-BERT를 제안한다. 우선 구글이 제안한 사전 학습된 BERT를 그대로 이용해서 패러프레이즈 데이터 (MRPC)를 가지고 파인 튜닝하였고 추가적으로 최근에 구글에서 새로 발표한 Whole Word Masking 기술을 사용하여 사전 학습된 BERT 모델을 새롭게 파인 튜닝하였다. 그리고 마지막으로 다중 작업 학습을 수행하여 성능을 향상시켰다. 구체적으로 질의 응답 태스크와 패러프레이즈 검출 태스크를 동시에 학습하여 후자가 더 잘 수행될 수 있도록 하였다. 결과적으로 점점 더 성능이 개선되었고 (11.11%의 정확도 향상, 7.88%의 F1 점수 향상), 향후 작업으로 파인 튜닝하는 방법에 대해서 추가적으로 연구할 계획이다.
PDF

Search Result 81, Processing Time 0.026 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)