• 제목/요약/키워드: 텍스트 인식

검색결과 779건 처리시간 0.032초

워드프로세서의 영어문장 어법오류 인식개선을 통한 영어구문작성 향상방안에 대한 연구 (A Study on the improvement of English writing by applying error indication function in word processor)

  • 이재일
    • 디지털융복합연구
    • /
    • 제18권2호
    • /
    • pp.285-290
    • /
    • 2020
  • 본 연구는 워드프로세서를 사용하여 영어텍스트구문을 작성하는 사용자들의 영어작문능력을 개선하는 방안을 제시하고자 한다. 컴퓨터와 IT기술의 발달로 영어작문능력 향상을 위한 컴퓨터보조언어학습이 보편적으로 사용되고 있다. 기존의 프로그램들은 일부 단어의 철자, 접속사의 필요성, 주어-동사의 수일치 등과 같은 몇몇 문법오류사항을 인식하여 표시해주는 기능이 있다. 그러나 사용자가 작성한 영어문장의 적절성에 대한 소수의 오류사항을 알려주고 있지만 영어문장에서 가장 흔하게 사용되고 있는 명사구성립의 적법성에 대한 오류인식은 하지 못하고 있다. 따라서 본 연구는 기존 워드프로세서의 문장오류인식 프로세스에 명사구성립인식 기능을 추가하여 더 나은 오류인식기능을 갖추도록 개선하여 사용자 편의성 및 문장적법성을 향상시키는 방안을 제시한다. 제안 방법은 문장 내에 사용된 명사를 추적하여 해당 명사가 문장요소로 사용되기 위한 최소단위인 명사구성립 여부를 확인하고 그에 따라 오류표기를 하여 사용자가 인식할 수 있도록 해준다. 사용자는 오류사항에 대한 인식을 통해 자신이 작성한 텍스트의 문장 적법성을 확인하고 수정하면서 문장작성 능력 및 적절한 어법의 사용에 대한 이해도가 증가할 것이라 판단된다.

음성특징의 다양한 조합과 문장 정보를 이용한 감정인식 (Emotion Recognition using Various Combinations of Audio Features and Textual Information)

  • 서승현;이보원
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 추계학술대회
    • /
    • pp.137-139
    • /
    • 2019
  • 본 논문은 다양한 음성 특징과 텍스트를 이용한 멀티 모드 순환신경망 네트워크를 사용하여 음성을 통한 범주형(categorical) 분류 방법과 Arousal-Valence(AV) 도메인에서의 분류방법을 통해 감정인식 결과를 제시한다. 본 연구에서는 음성 특징으로는 MFCC, Energy, Velocity, Acceleration, Prosody 및 Mel Spectrogram 등의 다양한 특징들의 조합을 이용하였고 이에 해당하는 텍스트 정보를 순환신경망 기반 네트워크를 통해 융합하여 범주형 분류 방법과 과 AV 도메인에서의 분류 방법을 이용해 감정을 이산적으로 분류하였다. 실험 결과, 음성 특징의 조합으로 MFCC Energy, Velocity, Acceleration 각 13 차원과 35 차원의 Prosody 의 조합을 사용하였을 때 범주형 분류 방법에서는 75%로 다른 특징 조합들 보다 높은 결과를 보였고 AV 도메인 에서도 같은 음성 특징의 조합이 Arousal 55.3%, Valence 53.1%로 각각 가장 높은 결과를 보였다.

  • PDF

도메인 지식을 이용한 랩퍼에서 규칙 생성 정확도 향상 (Improving Rule Generation Precision for Wrappers using Domain Knowledge)

  • 정창후;서정현;류범종;맹성현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.662-664
    • /
    • 2003
  • 기존의 도메인 지식 기반의 랩퍼 학습 방법은 도메인에 대한 정보를 바탕으로 해당 정보 소스에 대한 렙퍼를 생성한다. 응응 분야에 맞게 정의된 도메인 지식을 이용함으로써 정보 소스에서 제공하는 다양한 텍스트의 의미와 형태를 이해할 수 있다. 그러나 정보 소스에서 제공되는 모든 텍스트에 의미 인식의 근거가 되는 레이블이 붙어서 제공되는 것이 아니기 매문에, 도메인 지식만을 이용해서 랩퍼를 학습하는 방법은 한계에 부딪힐 수 밖에 없다. 이러한 문제를 해결하기 위해서 본 논문은 인터넷에 존재하는 다양한 웹 정보 소스에서 효율적이고 정확하게 랩퍼를 생성할 수 있도록 하는 도매인 지식 기반의 확률적 랩퍼 생성 시스템을 제안한다. 효율적이고 정확한 랩퍼 생성 시스템을 구축하기 위해서 도메인 지식뿐 아니라 상세 정보로 연결되어 있는 하이퍼렁크와 엔티티 인식을 위한 확률모델을 이용하였다. 이렇게 여러 가지 방법을 적용함으로써 사용자의 개입없이 다양한 정보 소스에 대해서 보다 추출 성능이 좋은 랩퍼를 생성할 수 있다.

  • PDF

안드로이드 기반 상황 인지 플랫폼 (A Context-aware Platform based on Android)

  • 김바울;김경덕;김상욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.222-225
    • /
    • 2010
  • 휴대전화는 다양한 기술들이 융합되고 유비쿼터스 환경과 결합되면서 진화하고 있다. 이런 모바일 환경으로 인해 사용자의 상황을 인식하는 상황인식 기반 서비스들의 수요가 증가하고 있으며 사용자들은 그 상황을 실시간으로 공유하고 보기를 원한다. 따라서 본 연구에서는 모바일 사용자의 주변 상황을 인지하고 그 상황 정보를 공유할 수 있는 컨텍스트폰 플랫폼을 제안한다. 제안하는 플랫폼은 안드로이드 플랫폼을 기반으로 하여 사용자의 주변 상황을 실시간으로 수집하며 사용자간 자동 상황 공유 메커니즘을 지원한다. 또한 사용자 연락처의 상황 수집과 컨텍스트폰 플랫폼간 논리적인 연결을 위해 컨텍스트 서버를 구축하였으며 서버는 사용자간 동시다발적으로 발생하는 상황정보를 저장하고 사용자간 상황 정보를 전달해 준다. 또한 플랫폼이 수집하는 상황정보를 시각적으로 표현하기 위해서 컨텍스트 뷰어 어플리케이션을 구현하였으며 모바일 스크린에 시각화하였다.

청각장애인을 위한 음성 인식 및 합성 애플리케이션 개발 (Development of Speech Recognition and Synthetic Application for the Hearing Impairment)

  • 이원주;김우린;함혜원;윤상운
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.129-130
    • /
    • 2020
  • 본 논문에서는 청각장애인의 의사소통을 위한 안드로이드 애플리케이션 시스템 구현 결과를 보인다. 구글 클라우드 플랫폼(Google Cloud Platform)의 STT(Speech to Text) API를 이용하여 음성 인식을 통해 대화의 내용을 텍스트의 형태로 출력한다. 그리고 TTS(Text to Speech)를 이용한 음성 합성을 통해 텍스트를 음성으로 출력한다. 또한, 포그라운드 서비스(Service)에서 가속도계 센서(Accelerometer Sensor)를 이용하여 스마트폰을 2~3회 흔들었을 때 해당 애플리케이션을 실행할 수 있도록 하여 애플리케이션의 활용성을 높인 시스템을 개발하였다.

  • PDF

데이터 균형을 위한 Chat-GPT와 Diffusion Model 기반 폐기물 생성모델 설계 (Design of a Waste Generation Model based on the Chat-GPT and Diffusion Model for data balance)

  • 김시웅;고준혁;박정현;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.667-669
    • /
    • 2023
  • 데이터의 균형은 객체 인식 분야에서 영향을 미치는 요인 중 하나이다. 본 논문에서는 폐기물 데이터 균형을 위해 Chat-GPT와 Diffusion model 기반 데이터 생성 모델을 제안한다. Chat-GPT를 사용하여 폐기물의 속성에 해당하는 단어를 생성하도록 질문하고, 생성된 단어는 인코더를 통해 벡터화시킨다. 이 중 폐기물과 관련 없는 단어를 삭제 후, 남은 단어들을 결합하는 전처리 과정을 거친다. 결합한 벡터는 디코더를 통해 텍스트 데이터로 변환 후, Stable Diffusion model에 입력되어 텍스트와 상응하는 폐기물 데이터를 생성한다. 이 데이터는 AI Hub의 공공 데이터를 활용하며, 객체 인식 모델인 YOLOv5로 학습해 F1-score와 mAP로 평가한다.

소셜미디어 빅데이터의 개체명 인식을 활용한 옥외 힐링 장소 인식 분석 (Outdoor Healing Places Perception Analysis Using Named Entity Recognition of Social Media Big Data)

  • 성정한;이경진
    • 한국조경학회지
    • /
    • 제50권5호
    • /
    • pp.90-102
    • /
    • 2022
  • 최근 힐링에 대한 관심이 증가함에 따라 힐링을 콘셉트로 하는 옥외 공간이 조성되고 있다. 보다 전문적이고 심층적인 옥외 힐링 장소 계획·설계·디자인을 위해 88,155건의 블로그 게시글 텍스트 데이터를 개체명 인식하여 텍스트 마이닝을 진행했다. 옥외 힐링 장소의 인식과 특징을 파악을 위해 출현 빈도 분석과 응집 분석을 진행하였다. 선행연구 고찰을 통해 힐링 장소의 6가지 요소를 도출하였으며, 시간과 인원을 추가한 총 8가지 요소를 통해 인식과 특성을 살펴보았다. 분석 결과 사람들은 힐링 장소를 방문하는 데 있어 장소적요소, 시간적요소, 사회적요소, 활동요소를 인원, 식물, 색상·형태, 심리적 요소보다 중요하게 생각하였다. 상위 출현 키워드를 통해 여러 가지 인식과 특성을 파악할 수 있었다. 응집 분석 결과를 통해 장소적요소, 시간적요소, 사회적요소의 키워드들이 응집되어 나타나 주로 어떤 장소, 어떤 시간대, 누구와 함께 방문하는지 구체적으로 살펴볼 수 있었다. 연구를 통해 실제 사람들이 작성한 인식 데이터를 대량 분석하여 힐링 장소의 인식과 특성을 도출하였으며, 계획과 마케팅적으로 활용할 수 있는 구체적인 요소가 나타남을 확인했다.

HMM을 이용한 채팅 텍스트로부터의 화자 감정상태 분석 (Emotional States Recognition of Text Data Using Hidden Markov Models)

  • 문현구;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.127-129
    • /
    • 2001
  • 입력된 문장을 분석하여 미리 정해진 범주에 따라 그 문장의 감정 상태의 천이를 출력해 주는 감정인식 시스템을 제안한다. Naive Bayes 알고리즘을 사용했던 이전 방법과 달리 새로 연구된 시스템은 Hidden Markov Model(HMM)을 사용한다. HMM은 특정 분포로 발생하는 현상에서 그 현상의 원인이 되는 상태의 천이를 찾아내는데 적합한 방법으로서, 하나의 문장에 여러 가지 감정이 표현된다는 가정 하에 감정인식에 관한 이상적인 알고리즘이라 할 수 있다. 본 논문에서는 HMM을 사용한 감정인식 시스템에 관한 개요를 설명하고 이전 버전에 비해 보다 향상된 실험결과를 보여준다.

  • PDF

N-Best Re-ranking에 기반한 한국어 음성 인식 성능 개선 (N-Best Reranking for Improving Automatic Speech Recognition of Korean)

  • 이정;서민택;나승훈;나민수;최맹식;이충희
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.442-446
    • /
    • 2022
  • 자동 음성 인식(Automatic Speech Recognition) 혹은 Speech-to-Text(STT)는 컴퓨터가 사람이 말하는 음성 언어를 텍스트 데이터로 전환하는 일련의 처리나 기술 등을 일컫는다. 음성 인식 기술이 다양한 산업 전반에 걸쳐 적용됨에 따라 높은 수준의 정확도와 더불어 다양한 분야에 적용할 수 있는 음성 인식 기술에 대한 필요성이 점차 증대되고 있다. 다만 한국어 음성 인식의 경우 기존 선행 연구에 비해 예사말/높임말의 구분이나 어미, 조사 등의 인식에 어려움이 있어 음성 인식 결과 후처리를 통한 성능 개선이 중요하다. 따라서 본 논문에서는 N-Best 음성 인식 결과가 구성되었을 때 Re-ranking을 통해 한국어 음성 인식의 성능을 개선하는 모델을 제안한다.

  • PDF

데이터베이스 유통매체로의 CD-ROM

  • 이만재
    • 디지털콘텐츠
    • /
    • 4호통권35호
    • /
    • pp.22-26
    • /
    • 1996
  • 국내외를 막론하고 CD-ROM은 데이터베이스의 제공이라는 차원보다는 멀티미디어 타이틀이라는 인식이 앞서고 있다. 현재 국내에서 데이터베이스 형태로 개발된 CD-ROM 타이틀은 조선일보 93, 이조실록, 문장대백과와 같은 텍스트 위주의 데이터베이스가 10여 종 있을 뿐이다.

  • PDF