[BigZami뉴스레터] 데이터기반 과학적 치안 활동으로 범죄 예방🚨& 온실가스 배출량의 9%를 차지하는 OO산업?
데이터 분석 솔루션 빅재미
2024. 11. 1.
No-Code 데이터 분석 솔루션 빅재미
데이터 분석 솔루션 빅재미
2024/11 Vol.35
안녕하세요. BigZami입니다. 🤗
11월의 첫 뉴스레터가 찾아왔습니다.
BigZami로 하는 경찰청 치안활동과 CO2 발생량 예측 분석 시나리오,
데이터 설계 시 꼭 챙겨야 할 사항을 소개해 드립니다.
BigZami, 경찰청의 데이터기반 과학적 치안활동에 사용돼 눈길
씨에스리에서는 자사의 AI 데이터 분석 솔루션 '빅재미(BigZami)'를 적용한 경찰청 데이터 기반 과학적 치안 활동 사례를 지난 23일부터 26일까지 인천 송도 컨벤시아에서 열린 국제치안산업대전(Korea Police World Expo)에서 소개했다고 밝혔습니다.
씨에스리는 경찰청 데이터정책팀과 함께 빅데이터 플랫폼 표준 분석 모델 개발 사업을 진행하였습니다. 빅재미를 이용한 CPO 범죄 예방 분석 모델, 기동 순찰대 배치 장소 선정 모델, AI 기반 정보 공개 청구 자동 비식별화 프로그램 등의 서비스를 개발하였습니다. 이를 통해 범죄 예방 분석 요구 사항을 분석하고, 데이터 통합 전처리 및 분석 모델과 시스템을 개발하여 배포했습니다.
빅재미는 오토엠엘(AutoML) 기술 등 4차 산업혁명 핵심인 AI 기술을 적용하여 전처리 시간을 절약함과 동시에 분석 러닝 커브를 단축해 줍니다. 또한 산업 디지털 전환(DX)을 지원하기 위한 AI 모델 개발에 활용할 수 있는 솔루션으로, GS 인증 1등급과 혁신 제품으로 지정되어 이미 많은 공공기관에 도입되어 사용되고 있습니다.
이춘식 씨에스리 대표는 “이번 데이터 기반 과학적 치안 활동 사례는 우리나라 경찰청에 빅재미가 활용되는 것을 넘어 조만간 해외에서도 빅재미를 통한 과학적 치안이 확대될 것”이라고 기대했습니다.
현재 철강산업이 전 세계 온실가스 배출량의 약 7~9%를 차지하고 있다고 합니다. 기후변화대응에 있어 많은 기업이 온실가스 저감 기술을 도입해 CO2 배출량을 감축하기 위한 노력을 하고 있습니다. 오늘은 철강산업 에너지 소비 데이터의 요소별 상관관계와 Load Type, 요일별, 월별 CO2 현황을 파악해 탄소배출 관리에 활용할 방법을 알아보겠습니다.
활용 데이터
이번 분석에서 사용할 데이터는 여러 종류의 코일, 강판, 철판을 생산하는 대우제철이 제공하는 데이터로 2018년 1월 1일 00:15부터 2018년 12월 31일 00:00까지 1년 동안 15분마다 수집한 철강산업 에너지 소비 데이터가 포함되어 있습니다.
- 크기: 35,040행, 11열 - 출처: University of California at Irvine (UCI) Machining Learning Repository - 라이선스: CC0 (자유 이용 저작물)
분석 요약
무효전력은 연결된 부하에서 소비되지 않고 발전소와 부하 사이를 왔다 갔다 하는 전력을 의미하고, 역률은 전류가 단위 시간에 하는 일의 비율을 의미합니다. 해당 데이터로 CO2 배출량에 영향을 미치는 변수들을 분석하여 CO2 배출량을 줄이기 위한 철강 산업 CO2 배출량 예측 모델을 학습했습니다.
- 첫째,EDA를 통해 데이터의 특성을 파악 - 둘째, 상관분석을 통해 CO2배출량과 높은 상관관계를 갖는 변수를 추출 - 셋째, 여러 모델을 학습하여 성능지표를 비교한 후 가장 성능이 좋은 학습모델로 CO2배출량을
예측하여 실제값과 예측값을 비교 - 넷째, 모델 학습에 높은 영향을 준 변수와 상관분석을 통해 파악한 상관관계가 높은 변수들을
개별적인 엔터티와 관계로 표현되는 데이터모델링 기법이 그동안 전통적으로 많이 사용되었다면, 최근에는 데이터 모델링 표현 방식에 있어 업무의 구성이나 흐름을 좀 더 정교하게 표현하고자 하는 실무적인 기법이 증가하고 있습니다. 이 중 단순히 엔터티와의 관계만으로 표현하는 전통적 데이터모델의 단점을 보완하여 객체지향의 장점을 포함한 모델이 확장형 데이터모델입니다. 데이터 설계 시 실무적으로 꼭 알아야 하는 몇 가지 영역은 다음과 같습니다.
1. DB의 출발점인 정규화 규칙을 실무적으로 제대로 알고 적용이 필요하다.
데이터 설계 정규화 이론은 누구나 배우지만, 그것을 실무적인 적용 관점에서 이해하고 기술로 적용하는 사례는 생각보다 훨씬 드뭅니다. 이론적 배경이 탄탄하다는 것은 곧 그것을 실무에 적용하여 견고한 데이터베이스를 만들어낼 수 있을 때라고 할 수 있으나, 대부분 학교에서 배우는 이론으로 생각하고 잘 모르는 경우가 많습니다.
2. 무작정 정규화된 모델은 조회 성능이 느리다고 생각하면 안 된다.
중복을 제거한 정규화는 기본적으로 조회, 입력, 수정, 삭제가 모두 빨라집니다. 한 가지 고려할 사항이 있다면 두 개 이상의 테이블로 처리되는 조인 처리인데, 이 부분도 인덱스 설계(PK-FK 인덱스 포함)를 정교하게 하면 성능 저하가 많이 나타나지 않는 경우가 90% 이상입니다. 정규화는 중복성을 제거하기 때문에 성능도 빨라진다고 생각하시기를 바랍니다. 전문 읽으러 가기
빅재미 사용 매뉴얼 - 분석
BigZami 완전 정복 여섯 번째 #데이터 분석1
🚨 쉽고 빠른 분석
BigZami에서 할 수 있는 데이터 분석 방법을 소개합니다. 70종 이상의 다양한 분석 블록에 R 코드가 내장되어 있으며, 간편하게 블록을 선택하고 연결하는 것만으로도 복잡한 전처리 및 분석 과정이 완료됩니다. 직관적인 워크플로우로 분석 흐름을 한눈에 파악할 수 있습니다.