• 제목/요약/키워드: N-GRAM

검색결과 576건 처리시간 0.029초

Nelumbo nucifera extracts mediated synthesis of silver nanoparticles for the potential applications in medicine and environmental remediation

  • Supraja, N.;Avinash, B.;Prasad, T.N.V.K.V.
    • Advances in nano research
    • /
    • 제5권4호
    • /
    • pp.373-392
    • /
    • 2017
  • Silver nanoparticles (AgNPs) were successfully synthesized through a simple green route using the Nelumbo nucifera leaf, stem and flower extracts. These nanoparticles showed characteristic UV-Vis absorption peaks between 410-450 nm which arises due to the plasmon resonance of silver nanoparticles. The Fourier transform infrared spectroscopy (FT-IR) confirmed the presence of amides and which acted as the stabilizing agent. X-ray diffraction spectrum of the nanoparticles confirmed the Face centered cubic (FCC) structure of the formed AgNPs. Dynamic light scattering technique was used to measure hydrodynamic diameter (68.6 nm to 88.1 nm) and zeta potential (-55.4 mV, -57.9 mV and 98.9 mV) of prepared AgNPs. The scanning electron micrographs of dislodged nanoparticles in aqueous solution showed the production of reasonably monodispersed silver nanoparticles (1-100 nm). The antimicrobial activity of prepared AgNPs was evaluated against fungi, Gram-positive and Gram-negative bacteria using disc diffusion method. Anti-corrosion studies were carried out using coupon method (mild steel and iron) and dye degradation studies were carried out by assessing photo-catalytic activity of Nelumbo nucifera extracts mediated AgNPs.

한국어 음소열 기반 워드 임베딩 기술 (Korean Phoneme Sequence based Word Embedding)

  • 정의석;송화전;이성주;박전규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.225-227
    • /
    • 2017
  • 본 논문은 한국어 서브워드 기반 워드 임베딩 기술을 다룬다. 미등록어 문제를 가진 기존 워드 임베딩 기술을 대체할 수 있는 새로운 워드 임베딩 기술을 한국어에 적용하기 위해, 음소열 기반 서브워드 자질 검증을 진행한다. 기존 서브워드 자질은 문자 n-gram을 사용한다. 한국어의 경우 특정 단음절 발음은 단어에 따라 달라진다. 여기서 음소열 n-gram은 특정 서브워드 자질의 변별력을 확보할 수 있다는 장점이 있다. 본 논문은 서브워드 임베딩 기술을 재구현하여, 영어 환경에서 기존 워드 임베딩 사례와 비교하여 성능 우위를 확보한다. 또한, 한국어 음소열 자질을 활용한 실험 결과에서 의미적으로 보다 유사한 어휘를 벡터 공간상에 근접시키는 결과를 보여 준다.

  • PDF

한국어 음소열 기반 워드 임베딩 기술 (Korean Phoneme Sequence based Word Embedding)

  • 정의석;송화전;이성주;박전규
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.225-227
    • /
    • 2017
  • 본 논문은 한국어 서브워드 기반 워드 임베딩 기술을 다룬다. 미등록어 문제를 가진 기존 워드 임베딩 기술을 대체할 수 있는 새로운 워드 임베딩 기술을 한국어에 적용하기 위해, 음소열 기반 서브워드 자질 검증을 진행한다. 기존 서브워드 자질은 문자 n-gram을 사용한다. 한국어의 경우 특정 단음절 발음은 단어에 따라 달라진다. 여기서 음소열 n-gram은 특정 서브워드 자질의 변별력을 확보할 수 있다는 장점이 있다. 본 논문은 서브워드 임베딩 기술을 재구현하여, 영어 환경에서 기존 워드 임베딩 사례와 비교하여 성능 우위를 확보한다. 또한, 한국어 음소열 자질을 활용한 실험 결과에서 의미적으로 보다 유사한 어휘를 벡터 공간상에 근접시키는 결과를 보여 준다.

  • PDF

단어와 클래스 기반의 한국어 언어 모델링 (Word and class-based language modeling for Korean)

  • 김길연;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.221-225
    • /
    • 2001
  • 본 논문에서는 대량의 말뭉치를 바탕으로 한국어에 대해 단어 기반의 n-gram 언어 모델과 클래스 기반의 언어 모델을 구축하고, 이를 실험적으로 검증한다. 단어 기반의 n-gram 모델링의 경우 Katz의 백오프와 Kneser-ney의 스무딩(smoothing) 알고리즘에 대해 실험을 수행한다. 클래스 기반의 언어 모델의 경우에는 품사 태그를 단어의 클래스로 사용한 경우와 말뭉치로부터 자동으로 구축된 클래스를 사용한 경우로 나누어 실험한다. 마지막으로 단어 기반 모델과 클래스 기반 모델을 결합하여 각각의 모델과 그 성능을 비교한다. 실험 결과 단어 기반의 언어 모델의 경우 Katz의 백오프에 비해 Knerser-ney의 스무딩이 보다 조은 성능을 나타내었다. 클래스 기반의 모델의 경우 품사 기반의 방범보다 자동 구축된 단어 클래스를 이용하는 방법의 성능이 더 좋았다. 또한, 단어 모델과 클래스 모델을 결합한 모델이 가장 좋은 성능을 나타냈다. 논문의 모든 알고리즘은 직접 구현되었으며 KLM Toolkit이란 이름으로 제공된다.

  • PDF

음성인식 리스코링을 위한 의존관계분석과 상호정보량 접근방법의 비교 (Dependency relation analysis and mutual information technique for ASR rescoring)

  • 정의석;전형배;박전규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.164-166
    • /
    • 2014
  • 음성인식 결과는 다수의 후보를 생성할 수 있다. 해당 후보들은 각각 음향모델 값과 언어모델 값을 결합한 형태의 통합 정보를 갖고 있다. 여기서 언어모델 값을 다시 계산하여 성능을 향상하는 접근 방법이 일반적인 음성인식 성능개선 방법 중 하나이며 n-gram 기반 리스코링 접근 방법이 사용되어 왔다. 본 논문은 적절한 성능 개선을 위하여, 대용량 n-gram 모델의 활용 문제점을 고려한 문장 구성 어휘의 의존 관계 분석 접근 방법 및 일정 거리 어휘쌍들의 상호정보량 값을 이용한 접근 방법을 검토한다.

  • PDF

광섬유 레이저 센서

  • 김향균
    • 한국광학회지
    • /
    • 제4권4호
    • /
    • pp.480-486
    • /
    • 1993
  • 희토류 첨가 광섬유 레이저의 편광모우드간의 맥놀이 주파수를 출력으로 하는 광섬유 레이저 센서를 제안하였고 이의 타당성을 실험을 통하여 증명하였다. N$d^{3+}$ 첨가 원형코어 광섬유 레이저를 이용하여 lateral stress를 측정하여 4.8kHz/gram의 선형적인 비례 상수를 얻었다. 또한 N$d^{3+}$ 첨가 첨가 편광유지 광섬유를 이용하여 온도 및 인장을 측정한 결과 30 kHz/$^{\circ}C$ -cm, 43 kHz/${\mu}m$의 선형적인 비례상수를 얻었다.

  • PDF

언어모델 기반 단어 클러스터링 알고리즘의 효율성 향상 기법 (An Improving Method of Efficiency for Word Clustering Based on Language Model)

  • 박상우;김영태;강동민;나동열
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2011년도 제23회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.55-60
    • /
    • 2011
  • 단어 클러스터링 (word clustering) 또는 군집화는 자연어처리에서 데이터 부족 문제로 인하여 단어 간의 의미관계와 관련된 정보를 사용하기 어렵게 만드는 문제에 대처할 수 있는 중요한 기술이다. 단어 클러스터링과 관련하여 알려진 가장 대표적인 기법으로는 클래스-기반 n-gram 언어모델의 개발을 위하여 제안된 Brown 단어 클러스터링 기법이다. 그러나 Brown 클러스터링 기법을 이용하는데 있어서 부딪치는 가장 큰 문제점은 시간과 공간적인 면에서 자원 소요량이 너무 방대하다는 점이다. 본 연구는 이 클러스터링 기법의 효율성을 개선하는 실험을 수행하였다. 실험 결과 가장 단순한(naive) 접근에 비하여 약 7.9배 이상의 속도 향상을 이룰 수 있음을 관찰하였다.

  • PDF

Cystocin, a Novel Antibiotic, Produced by Streptomyces sp. GCA0001: Biological Activities

  • Lee, Hei-Chan;Liou, Kwangkyoung;Kim, Dae-Hee;Kang, Sun-Yub;Woo, Jin-Suk;Sohng, Jae-Kyung
    • Archives of Pharmacal Research
    • /
    • 제26권6호
    • /
    • pp.446-448
    • /
    • 2003
  • Cystocin belongs to the class of nucleoside antibiotics from Streptomyces sp. GCA0001. Cystocin showed good activity against Gram-positive bacteria, but showed less activity against the Gram-negative bacteria. Cystocin exhibited about two to four folds higher activity than puromycin. Especially, cystocin shows relatively strong activity against Streptococcus strains. Cystocin shows quite potent antitumor activity against all of the cells tested showing $IC_{50}$ values of 0.10 to 0.14 $\mu$ g/mL. This in vitro result indicates that the cytotoxocity of cystocin is two ten folds more active than puromycin s.

정보검색 기법과 동적 보간 계수를 이용한 N-gram 적응 (N-gram Adaptation using Information Retrieval and Dynamic Interpolation Coefficient)

  • 최준기;오영환
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2005년도 추계 학술대회 발표논문집
    • /
    • pp.107-112
    • /
    • 2005
  • 연속음성인식을 위한 언어모델 적응기법은 특정 영역의 정보만을 담고 있는 적응 코퍼스를 이용해 작성한 적응 언어모델과 기본 언어모델을 병합하는 방법이다. 본 논문에서는 추가되는 자료 없이 인식 시스템이보유하고 있는 코퍼스만을 사용하여 적응 코퍼스를 구축하기 위해 언어모델에 기반한 정보검색 기법을 사영하였다. 검색된 적응 코퍼스로 작성된 적응 언어모델과 기본 언어모델과의 병합을 위해 본 논문에서는 입력음성을 분할하여 각 구간에 최적인 동적 보간 계수를 구하는 방법을 제안하였다. 제안된 적응 코퍼스를 구하는 방법과 동적 보간 계수는 기본 언어모델 대비절대 3.6%의 한국어 방송뉴스 인식 성능 향상을 보여주었으며 기존의 검증자료를 이용한 정적 보간 계수에 비해 상대 13.6%의 한국어 방송뉴스 인식 성능 향상을 보여 주었다.

  • PDF

구글 Trigram의 활용 사례: 문서 편집기로의 활용 (Use Case of Google Trigram: Application to Text Editor)

  • 황명권;이효갑;최동진;김판구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.3-5
    • /
    • 2010
  • 본 논문은 구글(Google)에서 제공하는 n-gram 데이터가 사람들에게 실제로 어느정도의 효율성을 제공할 수 있는지에 대한 내용을 다루고 있다. 이를 위해, 구글의 trigram만을 이용하며, 규모를 줄이기 위해 필터링 과정을 거쳐 trigram 데이터베이스를 형성하였다. 그리고 이를 반영할 수 있는 텍스트 에디터를 구현하여, 사람의 타이핑 속도에 따라 얻을 수 있는 효율성을 측정하였다. 실험 결과에서 n-gram 데이터가 업무 향상에 효율성을 제공할 수 있지만, 여전히 큰 규모의 데이터집합에서 검색하는데 소모되는 시간의 한계점을 발견할 수 있었다.