• 제목/요약/키워드: 키워드 분석

검색결과 1,723건 처리시간 0.029초

온라인 쇼핑몰에서 상품 설명 이미지 내의 키워드 인식을 위한 딥러닝 훈련 데이터 자동 생성 방안 (The way to make training data for deep learning model to recognize keywords in product catalog image at E-commerce)

  • 김기태;오원석;임근원;차은우;신민영;김종우
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.1-23
    • /
    • 2018
  • E-commerce 환경의 발전으로 소비자들은 다양한 상품들을 한 자리에서 폭 넓게 비교할 수 있게 되었다. 하지만 온라인 쇼핑몰에 올라와있는 상당량의 주요 상품 정보들이 이미지 형태이기 때문에 컴퓨터가 인지할 수 있는 텍스트 기반 검색 시스템에 반영될 수 없다는 한계가 존재한다. 이러한 한계점은 일반적으로 기존 기계학습 기술 및 OCR(Optical Character Recognition) 기술을 활용해, 이미지 형태로 된 키워드를 인식함으로써 개선할 수 있다. 그러나 기존 OCR 기술은 이미지 안에 글자가 아닌 그림이 많고 글자 크기가 작으면 낮은 인식률을 보인다는 문제가 있다. 이에 본 연구에서는 기존 기술들의 한계점을 해결하기 위하여, 딥러닝 기반 사물인식 모형 중 하나인 SSD(Single Shot MultiBox Detector)를 개조하여 이미지 형태의 상품 카탈로그 내의 텍스트 인식모형을 설계하였다. 하지만 이를 학습시키기 위한 데이터를 구축하는 데 상당한 시간과 비용이 필요했는데, 이는 지도학습의 방법론을 따르는 SSD 모형은 훈련 데이터마다 직접 정답 라벨링을 해줘야 하기 때문이다. 본 연구는 이러한 문제점을 해결하기 위해 '훈련 데이터 자동 생성 프로그램'을 함께 개발하였다. 훈련 데이터 자동 생성 프로그램을 통해 수작업으로 데이터를 만드는 것에 비하여 시간과 비용을 대폭 절감할 수 있었으며, 생성된 훈련용 데이터를 통해 모형의 인식 성능을 높일 수 있었다. 더 나아가 실험연구를 통해 자동으로 생성된 훈련 데이터의 특징별로 인식기 모형의 성능에 얼마나 큰 영향을 끼치는지 알아보고, 성능 향상에 효과적인 데이터의 특징을 분석하였다. 본 연구를 통해서 개발된 상품 카탈로그 내 텍스트 인식모형과 훈련 데이터 자동 생성 프로그램은 온라인 쇼핑몰 판매자들의 상품 정보 등록 수고를 줄여줄 수 있으며, 구매자들의 상품 검색 시 결과의 정확성을 향상시키는 데 기여할 수 있을 것으로 기대한다.

지자체 사이버 공간 안전을 위한 금융사기 탐지 텍스트 마이닝 방법 (Financial Fraud Detection using Text Mining Analysis against Municipal Cybercriminality)

  • 최석재;이중원;권오병
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.119-138
    • /
    • 2017
  • 최근 SNS는 개인의 의사소통뿐 아니라 마케팅의 중요한 채널로도 자리매김하고 있다. 그러나 사이버 범죄 역시 정보와 통신 기술의 발달에 따라 진화하여 불법 광고가 SNS에 다량으로 배포되고 있다. 그 결과 개인정보를 빼앗기거나 금전적인 손해가 빈번하게 일어난다. 본 연구에서는 SNS로 전달되는 홍보글인 비정형 데이터를 분석하여 어떤 글이 금융사기(예: 불법 대부업 및 불법 방문판매)와 관련된 글인지를 분석하는 방법론을 제안하였다. 불법 홍보글 학습 데이터를 만드는 과정과, 데이터의 특성을 고려하여 입력 데이터를 구성하는 방안, 그리고 판별 알고리즘의 선택과 추출할 정보 대상의 선정 등이 프레임워크의 주요 구성 요소이다. 본 연구의 방법은 실제로 모 지방자치단체의 금융사기 방지 프로그램의 파일럿 테스트에 활용되었으며, 실제 데이터를 가지고 분석한 결과 금융사기 글을 판정하는 정확도가 사람들에 의하여 판정하는 것이나 키워드 추출법(Term Frequency), MLE 등에 비하여 월등함을 검증하였다.

텍스트 마이닝을 통한 우리나라의 벼 도열병 발생 개황 분석 (Analysis of Rice Blast Outbreaks in Korea through Text Mining)

  • 송성민;정현정;김광형;김기태
    • 식물병연구
    • /
    • 제28권3호
    • /
    • pp.113-121
    • /
    • 2022
  • 벼 도열병은 전 세계적으로 발병하여 쌀 수확량을 크게 감소시키는 주요 식물병이다. 벼 도열병은 한국에서도 주기적으로 대발생하여 사회경제적으로 큰 피해를 입힌다. 이를 예방하기 위해서는 병 발생 예찰 시스템이 필요하다. 또한 병 발생에 대한 역학 조사는 식물병 관리를 위한 의사결정을 내릴 때 도움을 줄 수 있다. 현재 도열병 예찰 및 역학 조사는 주로 작물의 생육량, 기상 환경 요인 등 정량적으로 측정 가능한 정형 데이터를 기반으로 수행되고 있다. 정형 데이터와 함께 도열병 발생과 관련한 텍스트 자료들도 많이 축적되고 있다. 그러나 이러한 비정형 데이터를 이용한 역학 조사는 이루어지지 않고 있다. 비정형 데이터를 활용하여 유용한 정보를 추출한다면 도열병을 포함한 앞으로의 식물병 관리에 사용할 수 있을 것이다. 이 연구는 텍스트 마이닝을 통해 도열병 관련 뉴스 기사를 분석하여 우리나라에서 벼 도열병이 다발생한 연도와 지역을 조사하였고, 해당 지역의 평균 기온, 합계 강수량, 일조시간, 공급된 벼 품종을 분석하였다. 이를 통해 2020년 평년에 비해 낮은 기온과 일조시간 및 높은 강수량이 전국적인 도열병 다발생의 원인에 기여했고, 2021년 전라북도와 경상북도 일부 지역의 다발생은 비슷한 기상학적 요인에 의한 것으로 추측할 수 있었다. 더하여 같은 벼 품종의 연작에 의한 도열병 다발생 가능성과 질소 비료의 시비량이 병 발생에 미치는 영향에 대한 추후 연구가 필요하다. 결론적으로, 쏟아지는 정보의 홍수속에서 관련 기사를 종합적으로 보기 어렵다. 따라서, 텍스트 마이닝을 통해 얻은 결과로 특정 키워드들이 많이 관찰될 때 적극적 방제에 대한 의사결정을 할 수 있는 시스템이 구축될 필요가 있다. 이는 추후 딥러닝 기술과 접목되어 벼 도열병 역학 조사 도구로 사용될 수도 있을 것이다. 텍스트 마이닝을 통해 얻은 유의미한 정보를 기존의 정형 데이터 기반의 모델과 결합한다면 농업현장에서 병발생 예측 또는 방제기술 개선에 필요한 고품질 정보를 제공해줄 수 있을 것이라고 예상한다.

건강추천시스템(HRS) 연구 동향: 인용네트워크 분석과 GraphSAGE를 활용하여 (Research Trends of Health Recommender Systems (HRS): Applying Citation Network Analysis and GraphSAGE)

  • 장하렴;유지수;양성병
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.57-84
    • /
    • 2023
  • 현대사회는 정보통신기술 및 빅데이터 기술의 발전으로 누구나 인터넷을 통해 손쉽게 방대한 데이터를 얻고 활용할 수 있는 시대로, 양질의 데이터를 수집하는 능력을 넘어 수많은 정보 속에서 올바른 데이터만을 선별하는 능력이 더욱 중요해지고 있다. 이러한 기조는 학계에서도 이어지고 있는데, 축적되는 연구물 속에서 양질의 연구를 선별하여 올바른 지식구조를 형성하기 위해, 다양한 연구 분야에서 체계적 고찰(systematic review) 및 비체계적 고찰(non-systematic review)과 같은 문헌연구(literature review)가 수행되고 있다. 한편, 코로나19 팬데믹 이후 의료산업에서도 그동안 합의에 이르지 못했던 원격의료가 제한적으로나마 허용되고, 인공지능 및 빅데이터 기술이 응용된 건강추천시스템(health recommender systems: HRS)과 같은 새로운 의료서비스가 각광을 받고 있다. 하지만, 실무적으로 HRS가 미래 의료산업 발전을 이끌 중요한 기술로 평가받고 있음에도 불구하고, 학술적인 문헌연구는 다른 분야에 비해 매우 부족한 실정이다. 더불어 HRS는 학제적 성격이 강한 융합 분야임에도 불구하고, 기존의 문헌연구는 비체계적 고찰과 체계적 고찰 방법만을 주로 활용하여 이뤄졌기 때문에, 다른 연구 분야와의 상호작용이나 동적인 관계를 유추하기에는 한계가 존재한다. 이에, 본 연구에서는 인용네트워크 분석(citation network analysis: CNA)을 활용하여 HRS 및 주변 연구 분야의 전체적인 네트워크 구조를 파악하였다. 또한, 이 과정에서 최신 논문이 인용 관계가 잘 나타나지 않는 문제를 보완하기 위해 GraphSAGE 알고리즘을 적용함으로써, HRS 연구에 있어 'recommender system', 'wireless & IoT', 'computer vision', 'text mining' 등과 같은 연구 분야들의 중요도가 높아지고 있음을 파악하였으며, 이와 동시에 개인화(personalization) 및 개인정보보호(privacy) 등과 같은 새로운 키워드가 주요 이슈로 등장하고 있음을 확인하였다. 본 연구를 통해 HRS 연구 커뮤니티의 구조를 파악하고, 관련된 연구 동향을 살펴보며, 미래 HRS 연구 방향을 설계함에 있어 실질적인 통찰을 제공할 수 있을 것으로 기대한다.

텍스트 마이닝을 이용한 감정 유발 요인 'Emotion Trigger'에 관한 연구 (A Study of 'Emotion Trigger' by Text Mining Techniques)

  • 안주영;배정환;한남기;송민
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.69-92
    • /
    • 2015
  • 최근 소셜 미디어의 사용이 폭발적으로 증가함에 따라 이용자가 직접 생성하는 방대한 데이터를 분석하기 위한 다양한 텍스트 마이닝(text mining) 기법들에 대한 연구가 활발히 이루어지고 있다. 이에 따라 텍스트 분석을 위한 알고리듬(algorithm)의 정확도와 수준 역시 높아지고 있으나, 특히 감성 분석(sentimental analysis)의 영역에서 언어의 문법적 요소만을 적용하는데 그쳐 화용론적 의미론적 요소를 고려하지 못한다는 한계를 지닌다. 본 연구는 이러한 한계를 보완하기 위해 기존의 알고리듬 보다 의미 자질을 폭 넓게 고려할 수 있는 Word2Vec 기법을 적용하였다. 또한 한국어 품사 중 형용사를 감정을 표현하는 '감정어휘'로 분류하고, Word2Vec 모델을 통해 추출된 감정어휘의 연관어 중 명사를 해당 감정을 유발하는 요인이라고 정의하여 이 전체 과정을 'Emotion Trigger'라 명명하였다. 본 연구는 사례 연구(case study)로 사회적 이슈가 된 세 직업군(교수, 검사, 의사)의 특정 사건들을 연구 대상으로 선정하고, 이 사건들에 대한 대중들의 인식에 대해 분석하고자 한다. 특정 사건들에 대한 일반 여론과 직접적으로 표출된 개인 의견 모두를 고려하기 위하여 뉴스(news), 블로그(blog), 트위터(twitter)를 데이터 수집 대상으로 선정하였고, 수집된 데이터는 유의미한 연구 결과를 보여줄 수 있을 정도로 그 규모가 크며, 추후 다양한 연구가 가능한 시계열(time series) 데이터이다. 본 연구의 의의는 키워드(keyword)간의 관계를 밝힘에 있어, 기존 감성 분석의 한계를 극복하기 위해 Word2Vec 기법을 적용하여 의미론적 요소를 결합했다는 점이다. 그 과정에서 감정을 유발하는 Emotion Trigger를 찾아낼 수 있었으며, 이는 사회적 이슈에 대한 일반 대중의 반응을 파악하고, 그 원인을 찾아 사회적 문제를 해결하는데 도움이 될 수 있을 것이다.

국내 프로축구 팬들의 유니폼 소비 분석: 손흥민의 토트넘 홋스퍼 FC 이적 전후 비교 (Analysis of Football Fans' Uniform Consumption: Before and After Son Heung-Min's Transfer to Tottenham Hotspur FC)

  • 최영현;이규혜
    • 지능정보연구
    • /
    • 제26권3호
    • /
    • pp.91-108
    • /
    • 2020
  • 박지성 선수의 2005년 맨체스터 유나이티드 FC 입단 이후로, 국내에서 프로축구 유니폼 시장이 본격적으로 성장하기 시작했다. 이후, 국내 선수들의 해외 리그에서 활약이 계속되면서 국내에서도 잉글랜드 프리미어리그에 대한 대중의 관심이 지속되고 있다. 이러한 시점에서 본 연구는 국내 프로축구 팬들의 유니폼 소비에 전반적인 소비자 인식을 알아보고, 선수의 영입에 따른 소비자 인식 변화를 비교하고자 했다. EPL의 토트넘에서 활동하고 있는 손흥민 선수의 영입 전후를 중심으로 소셜 미디어에 나타난 프로축구 팬들의 소비자 인식과 구매 요인을 알아보았다. 'EPL 유니폼'을 키워드로, 국내 포털사이트와 소셜 미디어의 게시글을 수집하고, 텍스트 마이닝, SNA, 회귀분석을 사용하여 분석했다. 연구 결과, 첫째, 선수의 소속 팀, 실적, 포지션과 구단의 실적, 순위, 리그의 우승 여부가 프로축구 유니폼의 구매와 탐색에 있어 주요 요인으로 확인되었다. 가격, 디자인, 사이즈, 로고 등과 같은 항목보다 유니폼의 형태, 마킹, 정품 여부, 스폰서와 더 중요하게 작용하고 있었다. 둘째, 구조적 등위성 분석과 군집분석을 통해 국내 프로축구 팬들 사이에서 유니폼과 관련되어 언급되고 있는 주요 주제를 알아본 결과, EPL에 소속된 구단과 유명 선수들이 가장 핵심적인 주제로 나타났다. 셋째, 프로축구 유니폼에 대한 시기별 주제는 월드컵과 EPL 리그에 대한 관심에서 EPL에서 활동하는 다양한 국내외 선수들에 대한 관심으로, 2015년 이후에는 유니폼 자체에 대한 것으로 주제가 변화했다. 이를 통해, 선수들의 이적에 따라 선수가 소속된 해당 구단의 유니폼이 관심을 받고 있음을 알 수 있었다. 넷째, 남녀 소비자 모두 손흥민에 대한 관심이 증가함에 따라서 토트넘이 소속된 리그인 EPL에 대한 관심도 증가하는 것으로 나타났다. 여성의 경우 손흥민에 대한 관심이 증가함에 따라 축구 유니폼에 대해서도 관심을 가지는 것으로 나타난 반면, 남성의 경우 손흥민 선수에 대한 관심과 축구 유니폼에 대한 관심 사이의 관계가 유의하게 나타나지 않았다. 각 구단은 선수와 구단의 성적과 이미지 관리, 스폰서 브랜드 관리에 집중하고, 선수의 이적이 결정되면 선수의 자국에 해당 물량의 공급을 늘리며, 인기를 끌고 있는 선수의 등번호가 부착된 유니폼의 경우에는 여성을 위한 다양한 사이즈를 제공해야 할 필요가 있다.

도시별 이미지 전략 요인의 경향 분석 (Trend Analysis of Strategic Factors to Promote the Image of Cities)

  • 변재상
    • 한국조경학회지
    • /
    • 제36권2호
    • /
    • pp.80-98
    • /
    • 2008
  • 과거 도시경관의 목표가 범국가적으로 아름다운 도시 만들기였다면, 이제는 '살고 싶은 도시 만들기' 나아가 '나만의 도시 만들기'와 같은 각기 다른 도시 만들기가 도시 이미지 전략의 목표가 되고 있다. 본 연구에서는 기존의 선진 사례들을 분석하여 도시 이미지 정책의 경향을 새롭게 정리함으로써 오늘날 우리나라 도시에 적합한 도시 이미지 개선 전략을 제안하였다. 본 연구에서 도출된 결과는 다음과 같이 요약될 수 있다. 1. 도시 이미지는 랜드마크의 수립이나 장소 만들기, 축제, 특산품 등 다양한 전략적 수단을 통해 개선될 수 있으며, 이러한 요인은 경관 생태적 요인, 역사 문화적 요인, 행정 경제적 요인으로 분류된다. 2. 우리나라 광역시들은 풍부한 재정지원을 통해 주로 산업기반 시설설치, 기업지원, 광고 및 마케팅 등의 행정 경제적 요인들을 활용하여 도시 이미지 전략을 수립하여 추진하고 있다. 반면, 지방 도시들은 축제와 같은 저비용으로 단기적인 효과가 가시적으로 나타나는 수단만을 주로 활용하고 있다. 결국 축제 본연의 취지와는 달리 특별한 경쟁력이나 지역 정체성의 반영 없는 단순한 흥미 위주의 프로그램만을 되풀이하고 있기 때문에 중앙정부 차원에서의 전체적인 마스터플랜 수립과 이를 기초로 지역적 균형을 고려한 고유의 다양한 도시 이미지 전략수단 마련이 요구된다. 3.서구의 주요 도시들은 시대적 변화에 맞추어 고유의 정체성을 살린 자체적인 도시 이미지 전략을 수립하여 추진함으로써 도시 이미지를 한층 업그레이드 하고 있다. 한편, 일본은 다른 구미의 선진국들과 달리 오랜 역사를 기반으로한 고유의 전통 문화를 도시 이미지 전략의 핵심 키워드로 구축하여 다양한 전통축제 및 마을가꾸기 등을 추진하고 있다. 특히 자치단체의 기획안에 따라 적극적인 주민들의 호응과 참여 속에서 구미 도시와는 다른 독특한 도시브랜딩 정책을 추진하고 있다. 오늘날 소득 20,000달러 시대를 여는 시점에서 우리나라도 과거 선진사례에 대한 무비판적인 수용보다는 '한국다움'을 찾아내고 이를 토대로 하는 개성있고 다양한 도시 이미지를 확립하여야 할 것이다.

중소기업 구성원의 긍정심리자본, 직무소진, 조직시민행동의 영향관계 (A Study on the Influence of Positive Psychological Capital of Small and Medium Business Members, Job Burnout, and Organizational Citizen Behavior)

  • 최성용;하규수
    • 벤처창업연구
    • /
    • 제15권3호
    • /
    • pp.159-174
    • /
    • 2020
  • 본 연구는 긍정심리자본이 직무소진에 미치는 영향을 분석한 실증연구이다. 또한 긍정심리자본이 조직시민행동과 어떤 작용을 하며, 직무소진 간 블랙박스(Black box), 즉 매개변수로서 조직시민행동의 역할을 검증하고자 하였다. 그 다음에 조직시민행동의 하위요소를 개인지향 조직시민행동과 조직지향 조직시민행동의 둘로 나누어 함께 살펴보았다. 이를 위해 중소기업 구성원을 대상으로 설문조사를 실시하여 변수간의 관계를 비교분석 하였다. 긍정심리자본은 조직의 긍정적인 심리상태와 강점을 개발하여 효과성을 증진시킬 수 있기에 구성원의 직무소진을 감소시키고, 밀레니얼로 대변되는 젊은 세대들의 성향을 포용해 줄 수 있다는 점에서 그 관심이 높아지는 키워드로 연구의 필요성이 있다. 본 연구 결과 첫째, 중소기업 구성원의 긍정심리자본은 조직시민행동에 긍정적인 영향을 미치는 것으로 나타났다. 둘째, 긍정심리자본은 직무소진에 유의미한 부의 영향을 미쳤다. 셋째, 긍정심리자본과 조직시민행동이 직무소진에 어떠한 영향을 미치는가에 대한 검증이었다. 긍정심리자본과 직무소진의 영향 관계에서 조직지향 조직시민행동이 매개역할을 하는 것으로 나타났다. 다만 조직시민행동 중 개인지향의 조직시민행동은 유효하지 않은 것으로 밝혀졌다. 이 연구는 그 동안 서비스 접점 분야의 감정노동자(승무원, 간호사, 상담원 등)나 보육교사, 사회복지사 등에 주로 연구되던 긍정심리자본과 직무소진을 조직시민행동의 매개변수를 활용해 중소기업 구성원들에게 적용한 것에 그 시사점을 둘 수 있다. 중소기업 구성원들의 회사에 대한 애사심과 임직원간의 배려심 향상, 그로 인한 조직구성원들의 조직몰입과 업무성과 등은 이 긍정심리자본과 조직시민행동을 통해 더 제고될 수 있을 것이다. 또한 자본과 자원이 상대적으로 부족한 중소기업들에게 지속가능경영을 할 수 있는 모멘텀을 제공할 수 있을 것이다.

개별 기업에 대한 인터넷 검색량과 주가변동성의 관계: 국내 코스닥시장에서의 산업별 실증분석 (The Relationship between Internet Search Volumes and Stock Price Changes: An Empirical Study on KOSDAQ Market)

  • 전새미;정여진;이동엽
    • 지능정보연구
    • /
    • 제22권2호
    • /
    • pp.81-96
    • /
    • 2016
  • 최근 인터넷의 보편화와 정보통신 기술의 발달로 인해 인터넷을 통한 정보검색이 일상화 됨에 따라 주식에 관한 정보 역시 검색엔진, 소셜네트워크서비스, 인터넷 커뮤니티 등을 통해 획득하는 경우가 잦아졌다. 특정 단어에 대한 키워드 검색량은 사용자의 관심도를 반영하기 때문에 다양한 연구에서 개별 기업에 대한 인터넷 검색량은 투자자의 관심도에 대한 척도로서의 사용가능성을 각광받았다. 특정 주식에 대한 투자자의 관심이 증가할 때 일시적으로 주가가 상승하였다가 회복하는 반전현상은 여러 연구를 통해 검증되어 왔지만 그 동안 투자자의 관심도는 주로 주식거래량, 광고 비용 등을 사용해 간접적으로 측정되었다. 본 연구에서는 국내 코스닥 시장에 상장된 기업에 대한 인터넷 검색량을 투자자의 관심의 척도로 사용하여 투자자의 관심에 근거한 주가변동성의 변화를 전체 시장 측면과 산업별 측면에서 관찰한다. 또한 투자자 관심이 야기한 가격압박에 의한 주가 반전현상의 존재를 코스닥 시장에서 검증하고 산업 간의 반전정도의 차이를 비교한다. 실증분석 결과 비정상적인 인터넷 검색량 증가는 주가변동성의 유의적인 증가를 가져왔고 이러한 현상은 IT S/W, 건설, 유통 산업군에서 특히 강하게 나타났다. 비정상적인 인터넷 검색량의 증가 이후 2주 간 주가변동성이 증가하였고 3~4주 후에는 오히려 변동성이 감소하는 것을 확인하였다. 이러한 주가 반전현상 역시 IT S/W, 건설, 유통 산업군에서 보다 극단적으로 발생하는 것으로 나타난다.

개인 일기의 연구 자료로서의 가치와 전망 "5월12일 일기컬렉션"을 중심으로 (Value and Prosect of individual diary as research materials : Based on the "The 12th May Diaries Collection")

  • 최효진;임진희
    • 기록학연구
    • /
    • 제46호
    • /
    • pp.95-152
    • /
    • 2015
  • 일상아카이브란 '보통사람들'의 삶과 문화를 구체화, 범주화하여 이에 따라 개인이나 공동체, 더 나아가 한 사회의 기억과 이를 담은 기록물을 수집, 평가, 선별, 보존하는 조직이나 시설, 장소를 말한다. 일기를 비롯해 자서전, 회고록, 편지, 메모 등 실물자료와 온라인 공간에서 주고받는 블로그나 카페 게시물, SNS에 업로드되는 일상의 사진도 여기에 속한다. 이렇게 매 순간 생산되는 일상기록의 수집과 보존에 관한 필요성이 기록학계를 비롯해 다양한 분야에서 제기되고 있다. 특히 일기는 시대를 불문하고 한 개인이 매일같이 경험한 사실과 자아성찰 등을 정리한 글로서 기록의 원천성과 개별성, 유일성 등의 가치가 크게 중요시 되고 있다. 최근 여러 편의 일기들이 발굴, 소개되면서 역사학을 비롯해 다양한 인문사회과학 분야에서도 일기와 기록주체, 생산된 시대 연구가 이루어져왔다. 또한 언어학, 교육학, 심리학 등의 분야에서는 일기에서 관찰되는 언어습관, 문화수용양상, 저자의 감정이나 심리변화 등을 분석한다. 이 글에서는 국내외에서 이루어지는 일기 관련 연구 동향을 정리하고 이 맥락에서 일상기록으로서 "5월12일 일기컬렉션"이 갖는 의미를 찾는다. "5월12일 일기컬렉션"은 매년 5월12일 시민들이 직접 생산, 기증한 일기로 구성되어 있다. 명지대 디지털아카이빙연구소가 2013년 첫 '5월12일 일기수집 이벤트'를 개최한지 3년이 되는 현재 유치원생부터 80대 참가자들이 육필 (그림)일기, 전자문서, 디지털사진/영상, 음성녹음 등 다양한 유형으로 생산된 일기가 2천여 건 수집되었다. 이 글에서는 이렇게 수집된 일기를 정량적으로 분석하고 개별 기록물들이 어떤 내용을 담고 있는지를 살펴본다. 가족, 친구, 학교생활, 진로고민 등 연령별 지역별 직업별로 시민들의 생활상과 진솔한 고민을 읽을 수 있다. 개별 기록물에서 추출되는 키워드와 주제어에 따라 이 일기들이 담고 있는 주제를 더욱 포괄적으로 살펴보고자 한다. 또한 수집된 일기들을 형식과 내용에 따라 연구자료로 언어학, 교육학을 비롯해 역사학, 인류학 등 다양한 학문 분야에서 어떻게 활용될 수 있을지 그 연구 가능성을 제언해본다. 그리고 "5월12일 일기컬렉션"이 일상아카이브로서 수집, 보존되기 위해 필요한 과제가 무엇인지 살펴본다.