Büyük Veri ve Sağlıkta Kullanımı
Taha Özket
Büyük Veri Nedir?
İçinde bulunduğumuz dijital çağda her hareketimiz yazılımlar tarafından anlamlandırılacak bir veri setine dönüştürülmektedir. Bu sürece bizler gün içerisinde kullandığımız akıllı telefonlar, bileklikler, akıllı gözlükler ve diğer akıllı araçlarla katkıda bulunmaktayız. Geçtiğimiz on yıl öncesine kadar, sadece laboratuvarda verdiğimiz kan ya da çektirdiğimiz bir röntgen ile sağlık alanında katkı sağladığımız bu veri havuzu, şu anda zaman ve mekan farketmeksizin sürekli olarak bizlere ait verilerle beslenmektedir. Akıllı bilekliklerimizden bulut sistemlerine akan kalp atış hızımız, attığımız adım sayısı, uyku düzenimiz bu verilerden sadece bir kaç tanesini oluşturmaktadır. Aynı şekilde hem sağlığımızı ilgilendiren hem gündelik yaşantımız ile ilgili ipuçları veren söz konusu bu veri setlerinin makineler tarafından anlamlandırılarak, yorumlanabilir hale getirilmesi şu anda yazılım dünyasında en trend başlıklar arasında yer almaktadır.1
Büyük veriyi ele aldığımız bu çalışmamızda ilk olarak veri işleme ve anlamlandırma süreci değerlendirilecektir. Sonrasında veri setlerini oluşturma aşaması açıklanıp bu veri setlerinin anlamlandırılması ve makine tarafından yorumlanması örneklendirilecektir. Büyük verinin sağlık alanında kullanılma şekillerine değinilmesinin ardından sonuç kısmında ise büyük veri kullanımı, kişisel gizliliğin korunması çerçevesinde tartışılacaktır.
Akıllı bileklikten toplanan veri, zaman damgası ve değer olarak iki ana unsurdan oluşmaktadır. Örneğin bir kalp atış hızına ait veri seti kalp atış hızının ölçüldüğü ana ait zaman bilgisi ve o an yaşanan kalp atış hızının BPM [beat per minute] olarak değerinden oluşmaktadır. Bu veri setleri daha sonra yapılacak analiz ve makine öğrenme çalışmalarında kullanılmak üzere zaman serisi veri tabanlarına kaydedilmektedir.2
Verilerin yazılımlar tarafından anlamlandırılma süreci ilk olarak, farklı zamanlarda gelen bu verilerin çeşitli algoritmalar ile sınıflandırılmasıyla başlar. Örneğin Şekil 1’de, günün belirli saatlerinde meydana gelen kalp atışı hızlarındaki değişim oranları benzerliklerine göre kümelendirildiğinde, vücudun en aktif ve en pasif olduğu saatler gösterilmektedir.
Büyük verinin analizi esnasında kullanılan bazı yöntemleri aşağıdaki gibi sıralayabiliriz:
Kantitatif Analiz: Bir veri setinin ve sahip olduğu ilişkili verilerle sayısal sonuçlara ulaşılacak şekilde analiz edilmesidir. Belirli bir etken maddenin %1 artırılması sonucu 10 birimlik bir değişkenlik görülmesi bu tip analize örnek olarak verilebilir.3,4
Kalitatif Analiz: Bu analizde veri seti üzerinde kişilerin yorumları ve incelemeleri ile sözel, açıklayıcı sonuçlara ulaşılır.4
Veri Madenciliği: Büyük veri setleri üzerinde özel yazılım teknikleri kullanılarak istenilen bilgiye ulaşılmaya çalışılmasıdır. Veri seti üzerinde ilk bakışta farkedilmeyen şablonların gerçekleştirilen çalışmalarla ortaya çıkarılması, veri setinin anlamlı daha ufak parçalara bölünmesi veri madenciliği çalışmalarından birkaçını oluşturmaktadır.3,5
İstatistiksel Analiz: Eldeki verinin istatistiksel yöntemler kullanılarak özetleme (örneğin ortalama) ve daha küçük anlamlı veri setlerine dönüştürülmesi hedefiyle gerçekleştirilen analizdir. İstatistiksel analiz çıktısı sayısal veya yorum içeren sözel çıktılar olabilir.6
Makine Öğrenme: İnsanlar bir veri seti üzerinde tekrar eden, belirli bir şablon ile uyuşan verileri ayıklamada çok başarılı sonuçlar elde edebilmektedirler. Ancak bu başarılı sonuçlar veri seti büyüdükçe tekrarlanamamakta ve sonuçlar sınırlı seviyelerde kalmaktadır. Bu yüzden makine öğrenme yöntemleriyle çok büyük veri setleri üzerinde şablonların makine tarafından tespit edilmesi sağlanabilmektedir.3,7
e-Nabız: Kişisel Sağlık Sistemi
Sağlık Bakanlığı tarafından gerçekleştirilen e-Nabız projesiyle, hastaların tüm sağlık bilgilerine tek bir noktadan erişilmesine imkan sağlanmıştır. Proje kapsamında 1 Ocak 2015 sonrası gerçekleşen her türlü sağlık kaydının ortak bir platformda toplanarak, Sağlık Bakanlığı çatısı altında kurumlar tarafından erişilebilir olması hedeflenmektedir. e-Nabız içerisinde halihazırda tüm vatandaşlar sağlık geçmişlerine ulaşabilir, reçete ve raporlarını inceleyebilir, hastalık bilgisine ulaşıp, kendilerinden talep edilen tahlillerin sonuçlarını görebilir, sağlık görüntüleme sistemi üzerinden sisteme aktarılan manyetik rezonans, tomografi, röntgen görüntülerine ulaşabilirler. Sağlık kurumlarından girişi yapılan veriler dışında acil durum not girişi yaparak, herhangi bir acil durumda acil sağlık personelinin kendisine müdahale etme aşamasında ihtiyaç duyabileceği bilgileri paylaşabilirler.8
e-Nabız ve benzeri sağlık projeleri sağlık alanında büyük veri için ana kaynakları oluşturmaktadır. Bu sistemlere eklenecek verilerin kalitesi ve doğruluğu, bu veriler üzerinde daha sonra gerçekleştirilecek analiz çalışmalarına doğrudan etki edecektir. Bu verilerin işlenmesi ile sağlık alanında gündelik yaşantımıza etkileri aşağıda farklı örnekler ile anlatılmaya çalışılacaktır:
a. İlaç Etkileşimi: Bir hastanın daha önce kullandığı ilaç ve doz miktarının başka bir ilaç ile etkileşim gösterdiğine dair bilginin paylaşılması ve bu ilaç ve doz kombinasyonunu kullanacak diğer hastaların uyarılması sağlanabilmektedir. Ayrıca makine öğrenme yöntemleriyle, kullanılan ilaç verisi, hastalığın seyri, ortaya çıkan yan etkiler gibi bilgilerle dizayn edilmiş veri setlerinden, önleyici bir ilaç etkileşimi veri tabanı oluşturulması mümkündür.9
b. Gerçek Zamanlı Uyarı: Giyilebilir sağlık teknolojileri sayesinde, kişilere ait anlık veriler (örneğin kalp atış hızı) bu büyük veri setleri içerisinde tutularak yaşanacak bir anomali durumunda, ilgili kişi için acil durum prosedürlerinin harekete geçirilmesi sağlanabilecektir.10
c. Kanser Araştırmaları: Çağımızın en kompleks hastalıklarından biri olan kansere karşı savaş, teknolojinin her geçen gün ilerlemesiyle birden fazla cephede devam etmesine rağmen, tedavi süreçlerinde istenilen sonuçlara ulaşılamamaktadır. Bunun en büyük sebeplerinden birisi de kanser hastalarına ait verilerin toplanamayışı ve gerçekleştirilen kanser araştırmalarının çok küçük bir hasta gurubuna ait veri setleri üzerinden yürütülmeye çalışılmasıdır. Büyük veri bakış açısıyla toplanacak veri setleri üzerinde makine öğrenme yardımıyla çok farklı şekillerde analizler gerçekleştirilmesi sağlanabilecektir.11
d. Görüntüleme ve Derin Öğrenme: Makine öğrenmesinin sağlık alanında veri analizi konusunda geldiği noktaya yakın zamanlı bir örnek olarak, manyetik rezonans görüntüleme (MRG) ve fonksiyonel MRG (fMRG) çıktılarını kullanarak Alzheimer hastalığının sınıflandırılması verilebilir. Hastalara ait MRG ve fMRG verisinin makine öğrenme yöntemiyle analiz edilmesi sonucu, makinelerin Alzheimer hastalığına ait karakteristik semptomları ve özellikleri öğrenmesi sağlanmıştır. Bu karakteristiği öğrenen makineye başka hastalara ait MRG ve fMRG verisi gönderildiğinde hastalığın sınıflandırmasını %99 başarı oranıyla gerçekleştirmiştir.12
Farklı kaynaklardan toplanan büyük verinin makine öğrenme ile birlikte anlamlandırılmasıyla bu çıktılar sağlık alanında büyük yeniliklerin gerçekleşmesine neden olacaktır. Yüzlerce farklı hastaya ait veriler makine öğrenme yöntemleriyle yorumlanarak hastalığın farklı karakteristiklerinin ortaya çıkarılması mümkün olacaktır. Sağlık alanında tedavi aşamasında en önemli noktalardan biri olan sağlık geçmişine ait hikayeye doğru bir şekilde sahip olma problemi büyük veri yönetimi aracılığıyla ortadan kalkmaktadır. Kişinin doğduğu günden beri tüm sağlık geçmişi, kullandığı ilaçlar, yakalandığı hastalıklar ve tedavi geçmişleri büyük veri bakış açısıyla tutulduğu sürece, hekimler alacakları bir tedavi kararında bu hastanın tüm tedavi süreçlerine ulaşabilecekler ve ayrıca makinelerden bu konuda yönlendirici öneriler edinebilecektir.13
Kişisel Verilerin Korunması
Büyük veri ile birlikte makine öğrenme süreci sonucunda hayatımıza etki eden alanlar sadece sağlık uygulamalarından ibaret değildir. Her gün sosyal medya üzerinde karşı karşıya kaldığımız içeriklerin çok büyük bir kısmı bizlerin kişisel tercihlerine göre makine öğrenme algoritmalarıyla özel olarak karşımıza çıkartılmakta ve bazen bizleri bir ürünü satın aldırmaya yönelten kampanyalara dönüşebilmektedir.14 Bazı yönlendirmeler sadece talep, satın alma gibi dürtüleri uyarmaktan öte, siyasi konularda tercih değişikliği gibi çok daha temel alanları hedeflemektedir. Amerika’da gerçekleşen son başkanlık seçimlerinde Facebook üzerinden kullanıcıların siyasi görüşlerine göre yönlendirme kampanyaları düzenlediği tespit edilen Cambridge Analytica şirketi15 yakın zamanda büyük suçlamalara maruz kalmış ve bu olay üzerinden bir kez daha kişisel verilerin güvenliği sorgulanmaya başlanmıştır. Kullanıcılarının kişisel verilerini Cambridge Analytica şirketine paylaşmakla suçlanan Facebook, kişisel verilere erişim konusunda daha sert tedbirler almaya başlamıştır.16
Benzer bir risk durumuyla ülkemizde de daha önce karşılaşılmış ve kişisel verilerin kullanılması ile paylaşılması hususunda Danıştay, e-Nabız projesinin 24/11/2015 tarihinde aldığı kararla yürütmesini durdurmuştur. Yürütme durdurma gerekçesinde kişisel verilerin korunmasına ilişkin kanunun ülkemizde yer almaması ve e-Nabız kullanımıyla ortaya çıkacak bilgilerin paylaşılması durumunda ciddi problemlerin ortaya çıkacağına değinilmiştir. Kişisel verilerin korunmasının temel bir insan hakkı olduğuna yapılan atıfla, bu konuda bir kanunun yürürlüğe girmesinin gerekli olduğu belirtilmiştir.17 Bunun sonucu olarak, ülkemizde Kişisel Verileri Konuma Kanunu çıkarılmış, benzer şekilde Avrupa Birliği içerisinde Genel Veri Koruma Yönetmeliği ile kişisel verilerin toplanması ve işlenmesi konusunda bazı dü- hayatsağlık 33 zenlemeler getirilmiştir. Böylece en başta sağlık olmak üzere, kişisel verilerin toplanması ve diğer kurumlar ile paylaşılması tamamen kişinin iznine bırakılmış ve bu durum her ne kadar verinin sahipliğini düzenlemiş olsa da makine öğrenme tarafında ihtiyaç duyulan büyük veri setlerinin oluşması konusunda bir engel olarak görülmektedir.18
Sonuç olarak yaşamımızda görmezden geldiğimiz ya da farkında olmadığımız pek çok olgu, olay ve eylem veri setine dönüştürülerek büyük verinin oluşmasında etkili olmaktadır. Bu veri setleri makine öğrenme yöntemlerinin desteğiyle yaşam standardımızı yükseltmekte, iş gücü ve zamandan tasarruf edilmesine katkıda bulunmaktadır. Sağlık sistemlerinin büyük veriye entegrasyonu sonucu hem hastalıkların tedavisinde yüksek verim sağlanmakta hem de sağlık maliyeti düşürülebilmektedir. Ancak her teknolojik gelişme gibi büyük veride toplanan kişisel bilgilerin suistimal edilip kötüye kullanılma olasılığı mevcuttur. Bu durumun önüne geçmek için gelişen büyük veri teknolojisindeki kişisel verilerin yasalar ve otoriteler tarafından korumaya alınması gerekmektedir.
Kaynakça
1. Fleming N. How artificial intelligence is changing drug discovery. Nature. 2018;557(7707):S55-S57. doi:10.1038/d41586-018-05267-x.
2. Salamon J, Mouček R. Heart rate and sentiment experimental data with common timeline. Data Br. 2017;15:851-861. doi:10.1016/j.dib.2017.10.037.
3. Erl T, Khattak W, Buhler P. Big Data Fundamentals : Concepts, Drivers & Techniques. https://www. oreilly.com/library/view/big-data-fundamentals/9780134291185/. Accessed November 14, 2018.
4. Waller MA, Fawcett SE. Data Science, Predictive Analytics, and Big Data: A Revolution That Will Transform Supply Chain Design and Management. J Bus Logist. 2013;34(2):77-84. doi:10.1111/jbl.12010.
5. Xindong Wu, Xingquan Zhu, Gong-Qing Wu, Wei Ding. Data mining with big data. IEEE Trans Knowl Data Eng. 2014;26(1):97-107. doi:10.1109/ TKDE.2013.109.
6. Wang C, Chen M-H, Schifano E, Wu J, Yan J. Statistical methods and computing for big data. Stat Interface. 2016;9(4):399-414. doi:10.4310/SII.2016.v9.n4.a1.
7. Luo G, Stone BL, Johnson MD, et al. Automating Construction of Machine Learning Models With Clinical Big Data: Proposal Rationale and Methods. JMIR Res Protoc. 2017;6(8):e175. doi:10.2196/resprot.7757.
8. İleri Y, Uludag A. e-Nabız Uygulamasının Yönetim Bilişim Sistemleri ve Hasta Mahremiyeti Açısından Değerlendirilmesi. Uluslararası Sağlık Yönetimi ve Strat Araştırma Derg. 2017;3(3):318-325. http://dergipark. gov.tr/usaysad/issue/33254/370192. Accessed November 14, 2018.
9. Gao M, Igata H, Takeuchi A, Sato K, Ikegaya Y. Machine learning-based prediction of adverse drug effects: An example of seizure-inducing compounds. J Pharmacol Sci. 2017;133(2):70-78. doi:10.1016/j. jphs.2017.01.003.
10. Kakria P, Tripathi NK, Kitipawang P. A Real-Time Health Monitoring System for Remote Cardiac Patients Using Smartphone and Wearable Sensors. Int J Telemed Appl. 2015;2015:1-11. doi:10.1155/2015/373474.
11. Kourou K, Exarchos TP, Exarchos KP, Karamouzis M V., Fotiadis DI. Machine learning applications in cancer prognosis and prediction. Comput Struct Biotechnol J. 2015;13:8-17. doi:10.1016/j.csbj.2014.11.005.
12. Sarraf S, DeSouza DD, Anderson J, Tofighi G, Initiativ for the ADN. DeepAD: Alzheimer′s Disease Classification via Deep Convolutional Neural Networks using MRI and fMRI. bioRxiv. January 2017:070441. doi:10.1101/070441.
13. IBM’s Watson is better at diagnosing cancer than human doctors, WIRED UK. https://www.wired.co.uk/ article/ibm-watson-medical-doctor. Accessed November
14, 2018. 14. Bhatt B, Patel PJ, Gaudani H, Professor A. A Review Paper on Machine Learning Based Recommendation System. Vol 2.; 2014. www.ijedr.org. Accessed November 14, 2018.
15. Facebook fined £500,000 for Cambridge Analytica scandal – BBC News. https://www.bbc.com/news/technology-45976300. Accessed November 14, 2018.
16. Suspending Cambridge Analytica and SCL Group From Facebook, Facebook Newsroom. https://newsroom.fb.com/news/2018/03/suspending-cambridge-analytica/. Accessed November 14, 2018.
17. T.C Danıştay Onbeşinci Daire, Esas No: 2015/2900 – Google Search. http://www.tdb.org.tr/userfiles/files/ Danistay_15_Daire_ENo2015_2900_Enabiz.pdf
18. Mostert M, Bredenoord AL, Biesaart MCIH, van Delden JJM. Big Data in medical research and EU data protection law: challenges to the consent or anonymise approach. Eur J Hum Genet. 2016;24(7):956-960. doi:10.1038/ejhg.2015.239.
Hayat Sağlık Dergisinin 18. sayısında yayınlanmıştır.