• 제목/요약/키워드: 실시간 언어

검색결과 613건 처리시간 0.028초

실시간 트위터 분석을 통한 트렌드 및 연관키워드 추출 (Trend and related keyword extraction based on real-time Twitter analysis)

  • 김대용;김대훈;황인준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.1710-1712
    • /
    • 2012
  • 최근 Twitter를 비롯한 소셜 네트워크 서비스의 급속한 확산으로 인해, 많은 수의 SNS 메시지가 실시간으로 생성되고 있다. 이러한 SNS상에서의 단문 글들을 실시간으로 분석하여 최신의 트렌드를 추출해 낼 수 있다면, 사용자에게 유용한 정보를 제공하는 것이 가능하다. 본 논문에서는 다량의 Tweet글들에 대한 실시간 분석을 바탕으로 트렌드를 추출하고 연관된 키워드를 제공하는 기법을 제안한다. 제안하는 기법은 실시간으로 생성되는 Tweet내에서 영어의 언어적 특성을 활용하여 최근 이슈화된 트렌드 키워드를 추출해낸다. 또한, Tweet 내에서 각 트렌드 키워드간 관계를 분석하여 연관 키워드를 제공하며, 동시에 Wikipedia와 Google에서의 검색을 통하여 다른 형태의 연관 키워드도 추출한다. 이 모든 과정은 제안된 트렌드 추출 알고리즘을 통해 실시간으로 제공된다. 제안된 기법을 바탕으로 시스템을 구현하고 다양한 실험을 통하여 키워드의 유효성 및 처리 속도 면에서 시스템의 성능을 평가한다.

유비쿼터스 환경에서 실시간 센서 데이터를 위한 XML 질의언어 처리 엔진 (An XQuery Processing Engine for Real-Time Sensor Data in Ubiquitous Environments)

  • 임형준;김재훈;이규철
    • 한국전자거래학회지
    • /
    • 제15권4호
    • /
    • pp.1-19
    • /
    • 2010
  • 최근에 유비쿼터스나 전자상거래와 같은 환경에서 발생하는 실시간 데이터를 처리해야 하는 요구가 늘어나고 있다. 유비쿼터스 환경에서 사용되는 센서 데이터는 그 크기가 작고 XML 문서로 표현 되어 있으며 대량으로 발생하는 특징이 있다. 이러한 대량의 센서 데이터를 처리하기 위한 효율적인 방법이 요구되고 있다. 센서 데이터에 대한 XML 질의언어(XQuery)는 주로 센서 데이터가 발생한 센서의 식별자나 표현하고자 하는 정보를 얻어오는 것과 사용자의 편의를 위한 결과 재구성으로 분류된다. 기존의 XML 질의언어 엔진들은 센서 데이터를 일괄적으로 처리하기 위한 효율적인 방법을 가지고 있지 않다. 본 논문에서는 대량의 센서 데이터들을 실시간으로 처리하기 위하여 역 경로 요약을 이용한 가지 질의(Twig Query) 처리 기법을 적용하였다. 또한, 재구성(Restructuring) 일괄 처리 기법을 개발하여 적용하였다. XMark와 RFID EPC 데이터를 이용한 성능 측정을 하고 MonetDB/XQuery와 Oracle Berkeley DB XML과의 비교 분석을 수행하였다.

운영체계 소프트웨어

  • 강석열
    • ETRI Journal
    • /
    • 제8권2호
    • /
    • pp.83-91
    • /
    • 1986
  • 컴퓨터의 많은 응용에 따라 분산처리, 실시간처리, 고장감내처리 등에 대해 운영체계의 연구가 많이 되어왔다. 본고는 한국형 전전자교환기인 TDX-1 시스팀에서 사용된 TDXOS의 실현과 그 특성에 관해 서술하였다. TDXOS는 고실시간처리(Hard real time processing)와 분산처리, 컴퓨터의 이중화, 과부하제어, 실시간 디버거(Debugger) 들을 실현하였으며 뱅크(Bank)시스팀 형태의 메모리 관리기법이 사용되었다. 특히, 소형 마이크로프로세서(Z80) 및 어셈블리 언어에 최적의 동작 환경을 제공하도록 설계되어 실시간의 효율이 최대화되었다.

  • PDF

SyncCharts를 이용한 UML Statecharts 의미론 (Semantics Of UML Statecharts by SyncCharts)

  • 이수영;김진현;이장수;최진영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.349-351
    • /
    • 2003
  • Statecharts는 UML에서 시스템의 행위를 표현하기 위한 핵심적인 언어로서 다양한 분야에 응용되고 있다. 그 의미론은 수학적인 방법으로 기술되어 있으나 실제로 응용하여 구현하는데에는 상당히 많은 과정을 거쳐야 한다. 본 논문에서는 UML Statecharts와 유사한 언어인 SyncCharts로 정의한다. SyncCharts는 Esterel의 정형명세 언어에 기반한 도식적인 언어로서 그 의미론은 물론 내장형 시스템의 코딩을 위해 잘 정의되고 진화된 언어이다. 본 논문에서는 SyncCharts를 이용하여 Statecharts의 의미론을 정의한다. 특히 실시간적인 행위 측면에서의 동기적 시간 의미론과 비동기적 시간 의미론을 모두 정의한다. 이렇게 함으로써 UML Statecharts의 실시간과 관련된 의미론을 정의한다. 그에 더하여 SyncCharts의 명세를 통해 어떻게 구현이 가능한지를 보임으로서 실제 Statecharts를 이용한 검증 및 구현 과정을 보인다.

  • PDF

PtolemyII의 CCS 도메인 구현 (The Implementation of CCS Domain in PtolemyII)

  • 황혜정;김일곤;최진영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.118-120
    • /
    • 2003
  • PtolemyII의 CSP 도메인은 병렬 시스템을 효과적으로 명세할 수 있는 프로세스 알제브라 언어인 CSP를 구현한 것이다. CCS도 프로세스 알제브라 언어로써 정형적으로 병렬시스템을 명세하고 검증할 수 있다. 이 두 언어는 비슷한 목적으로 가지고 개발되었으나 통신의 세부적인 부분의 개념에 있어서 차이가 존재한다. 특히 CCS 를 기반으로 하여 개발된 ACSR 의 경우 실시간 시스템을 정형적으로 명세하고 검증하기 위해 필요한 시간과 자원의 개념을 추가하였다. 본 논문에서는 ACSR 도메인을 PtolemyII에 구현하기 위한 단계적인 방법으로 CCS와 CSP의 차이점을 밝혀서, 기존의 CSP 도메인의 Rendezvous 알고리즘을 CCS 기반의 통신이 이루어 질 수 있도록 수정하여 PtolemyII에 CCS 도메인을 구현하였다.

  • PDF

분산처리 진단/교정 시스템을 위한 자바 디버깅 정보 추출에 관한 연구 (A Study of Java Debugging Information Extract for Distributed Diagnosis and Correction System.)

  • 류동항;정민수;윤기송
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (3)
    • /
    • pp.102-104
    • /
    • 1999
  • RPC에 기반한 분산처리 진단/교정 시스템에서는 C/C++ 언어를 위한 디버깅을 지원한다. 본 논문에서는 이 시스템에 자바 언어에 대한 디버깅 지원을 위한 정보 추출부를 설계하였으며 각각의 정보 추출 모듈을 작성하였다. 자바 언어에서는 C/C++과 달리 디버깅 정보가 런 타임시에 결정되는 경우가 많기 때문에 이에 대한 적절한 정보 제공이 요구된다. 본 논문에서 제공하는 자바 디버깅 정보를 이용하여 분산환경의 네트워크 상에서 사용자에게 다양한 자바 디버깅 정보를 실시간으로 제공할 수 있다.

  • PDF

언어모델 군집화와 동적 언어모델 보간을 통한 음성인식 성능 향상 (LM Clustering based Dynamic LM Interpolation for ASR N-best Rescoring)

  • 정의석;전형배;정호영;박전규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.240-245
    • /
    • 2015
  • 일반영역 음성인식은 n-gram 희소성 문제로 인해 대용량의 언어모델이 필요하다. 대용량 언어모델은 분산형 모델로 구현될 수 있고, 사용자 입력에 대한 동적 언어모델 보간 기술을 통해 음성인식 성능을 개선할 수 있다. 본 논문은 동적 언어모델 보간 기술에 대한 새로운 접근방법을 시도한다. 텍스트 군집화를 통해 주제별 언어모델을 생성한다. 여기서 주제는 사용자 입력 영역에 대응한다. 본 논문은 사용자 입력에 대하여 실시간으로 주제별 언어모델의 보간 가중치 값을 계산하는 접근 방법을 제시한다. 또한 언어모델의 보간 가중치 값 계산의 부담을 감소하기 위해 언어모델 군집화를 통해 대용량 언어모델 보간 접근 방법의 연산 부담을 해소하기 위한 시도를 한다. 주제별 언어모델에 기반하고 언어모델 군집화를 통한 동적 언어모델 보간 기술의 실험 결과 음성인식 오류 감소율 6.89%를 달성했다. 또한 언어모델 군집화 기술은 음성인식 정확도를 0.09% 저하시켰을 때 실행 시간을 17.6% 개선시키는 실험결과를 보였다.

  • PDF

IMT-2000 음성 부호화 알고리즘의 실시간 DSP 구현 (Real-time DSP implementation of IMT-2000 speech coding algorithm)

  • 서정욱;권홍석;박만호;배건성
    • 대한전자공학회논문지SP
    • /
    • 제38권3호
    • /
    • pp.68-68
    • /
    • 2001
  • 본 논문에서는 3GPP와 ETSI에서 IMT-2000의 음성부호화 방식 표준안으로 채택한 AMR 음성부호화 알고리즘을 분석하고 C 컴파일러와 어셈블리 언어를 이용한 최적화 과정을 거친 후, 고정 소수점 DSP 칩인 TMS320C6201을 이용하여 실시간 구현하였다. 구현된 codec의 프로그램 메모리는 약 31.06 kWords, 데이터 RAM 메모리는 약 9.75 kWords, 그리고 데이터 ROM 메모리는 약 19.89 kWords 정도를 가지며, 한 프레임(20 ms)을 처리하는데 약 4.38 ms가 소요되어 TMS320C6201 DSP 칩의 전체 가용한 clock의 21.94%만 사용하여도 충분히 실시간으로 동작 가능함을 확인하였다. 또한, DSP 보드상에서 구현한 결과가 ETSI에서 공개한 ANSI C 소스 프로그램의 수행 결과와 일치함을 검증하였고, 구현된 AMR 음성부호화기를 sound I/O 모듈과 결합하여 실험한 결과, 어떠한 음질의 왜곡이나 지연 없이 실시간으로 충분히 동작함을 확인하였다. 마지막으로, Host I/O와 LAN 케이블을 이용하여 AMR 음성부호화 알고리즘을 통한 쌍방간 실시간 통신을 full-duplex 모드로 확인하였다.

중국어 음성합성을 위한 지진 벡터 기반 실시간 미등록어 처리 (Real-time Unknown Word Identification Using Support Vector Machine For Chinese Text-to-Speech)

  • 하주홍;정옥;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.267-272
    • /
    • 2003
  • 음성 합성 시스템 구축에 있어서 입력 텍스트를 정확한 발음 표기로 변환하는 것은 매우 중요하다. 중국어에는 하나의 한자가 의미나 사용에 따라 다르게 발음되는 다음자(polyphony)들이 존재한다. 다음자의 처리는 상당히 복잡한 문제이기 때문에 본 논문에서는 그 중 가장 발음에 영향을 미치는 요소인 인명과 지명에 대한 미등록어 처리를 수행했다. 무엇보다 실시간 음성 합성 시스템을 위해서는 처리 속도의 향상이 요구된다. 따라서 본 연구에서는 미등록어 후보 구간 선정을 선행하고, 선정된 후보에 대해 추정하는 두 단계로 진행하였다. 후보 구간 선정은 단일 한자 단어(monosyllable word)의 확률과 간단한 패턴들을 이용한다. 최종 선정된 후보의 미등록어 추정은 SVM(Support Vector Machine)을 기반으로 실시하였다.

  • PDF

Unix 환경에서 실시간 스케쥴링을 지원하기 위한 접근 방안 (An Approach for Supporting Real-Time Scheduling in the Unix Evironment)

  • 김상욱;김진호;김대용;이승선;최완
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권2호
    • /
    • pp.176-188
    • /
    • 1999
  • 태스크의 마감 시간을 고려하지 않는 시분할 스케쥴링 방식으로 인하여 범용 운영 체제는 실시간 시스템을 개발하는데 적합하지 않다고 알려져 있다. 그러나 범용 운영 체제상에서 실시간 스케쥴링을 지원할수 있다면 개발된 시스템은 높은 이식성, 훌륭한 개발환경의 활용, 그리고 개발된 시스템을 위한 낮은 유지 보수 및 보수 비용 등 범용 운영 체제 고유의 중요한 장점들을 얻을 수있다. 본 논문에서는 범용 운영 체제인 Unix 상에 태스크의 마감 시간을 고려함으로써 실시간 고려함으로써 실시간 스케쥴링을 지원할 수 있는 새로운 기법을 제안한다. 제안된 기법은 특수한 태스크인 스케쥴링 데몬이 수행되는 실시간 태스크들 중 마감 시간이 가장 임박한 하나만을 수행 준비 상태로만들고, 그 외의 다른 시릿간 태스크들은 모두 수면 상태에 있도록 만드는 방식을 사용한다. 따라서 Unix 스케쥴러는 항상 유일한 태스크만을 스케쥴링의 대상으로하므로 시분할 방식의 Unix 스케쥴링 전략을 바이패스할 수 있으며, 이 결과 스케쥴링 데몬의 전략에 의하여 모든 실시간 태스크들을 스케쥴링 할 수 있다. 본 연구에서는 제안된 실시간 스케쥴링 데몬 기법을 Unix상에서 구현하였으며, C 언어 라이브러리 함수 형태의 API를 제공함으로써 실시간 시스템 개발자가 쉽게 시스템을 개발할수 있는 플랫폼을 구축하였다. 또한 실험을 통하여 이용한 성능 분석을 통하여 기존의 기법들과 비교한 제안된 기법의 우수성을 보였다.