Logo ms.artbmxmagazine.com

Perlombongan data, teks dan perasaan. data besar dalam organisasi

Isi kandungan:

Anonim

PENGENALAN

Tanpa keraguan, nilai paling berharga yang dimiliki umat manusia adalah pengetahuan, yang telah disimpan dengan cara yang berbeza selama bertahun-tahun.

Hari ini pengetahuan ini dapat diketahui dengan nama data atau maklumat, yang tidak hanya disimpan, tetapi juga dianalisis untuk mendapatkan hasil.

Inilah bagaimana konsep data, teks dan perlombongan sentimen dilahirkan, dalam usaha untuk meramalkan masa depan dan memudahkan pengambilan keputusan.

Konsep perlombongan data, teks dan perasaan adalah topik yang muncul dalam masyarakat hari ini kerana adanya banyak maklumat, konsep ini telah dikembangkan dalam berbagai bidang kehidupan seharian, seperti pendidikan, kesihatan, biologi, analisis pasaran, telekomunikasi, hanya untuk beberapa.

Mereka adalah proses berkomputer yang mengenal pasti corak tingkah laku untuk membuat ramalan tindakan masa depan.

SEJARAH DATA

Berkat pengkhususan individu selama bertahun-tahun, keperluan untuk melindungi maklumat yang mereka hasilkan, seperti penyiasatan atau hak milik, maklumat asas mengenai penduduk termasuk kematian, kelahiran dan sijil perkahwinan.

Dengan berlalunya masa, umat manusia tidak berpuas hati dengan perlindungan fizikal maklumat tersebut, sehingga mereka secara beransur-ansur mengembangkan alat elektronik yang akan memudahkan pengurusan data, dan juga sejumlah besar penyimpanan.

Selama abad ke-20, pelbagai teknologi seperti fotolistrik, penampilan pita magnetik, komputer pertama seperti UNIVAC, direkodkan, tetapi tidak sampai akhir tahun 1960-an sebuah artikel diterbitkan yang mendefinisikan model asas. data seperti itu.

Kini pangkalan data besar yang mampu menghasilkan, mengumpulkan dan memproses sejumlah besar maklumat diuruskan, ciri-ciri ini secara beransur-ansur dimaksimumkan, menjadi lebih kuat dan kuat (Martínez, E., 2000)

DATA BESAR DALAM ORGANISASI

Organisasi menggunakan istilah ini lebih kerap berkat pelbagai faktor atau media penyimpanan seperti yang disebut "awan", Big data menggunakan alat seperti: perlombongan teks, perlombongan data dan perlombongan sentimen untuk memudahkan membuat keputusan, menjadikan organisasi semakin cekap.

Berkat teknologi canggih, saiz penyimpanan telah meningkat, begitu juga dengan kos yang dijana oleh penggunaan elemen-elemen ini untuk organisasi.

Organisasi mempunyai objektif utama untuk menjadi lebih cekap dan memperoleh pulangan yang lebih tinggi, sehingga mereka menambah analisis data mereka, teknik terstruktur atau konvensional dan teknik tidak berstruktur atau separa berstruktur, seperti syarikat perlombongan yang disebutkan di atas, yang memperoleh maklumat mereka dari foto, audio, video, buku, antara lain.

Bahawa mereka dapat memberikan kesimpulan dari data yang dianalisis secepat mungkin, semua ini untuk mendapatkan kelebihan daya saing, data yang umumnya ditangani dalam pengertian ini adalah sebagai berikut:

  • Data dari syarikat tradisional (transaksional). Maklumat umum mengenai pelanggan, pembekal, bekalan, dll. Data yang dihasilkan oleh sensor data. Secara amnya, mereka adalah sensor yang diintegrasikan ke dalam peralatan yang berbeza sejak pengeluarannya, mereka juga disebut meter pintar, termasuk data sosial. Semua rangkaian sosial yang disediakan oleh internet disertakan, yang paling terkenal adalah Twitter atau Facebook, dan elemen seperti fotografi dan audio. Data yang dihasilkan oleh mobiliti. Secara amnya disediakan oleh peralatan teknologi mudah alih, seperti Tablet, Telefon Pintar, atau melalui Skype (Joyanes, L., 2013)

PERLOMBONGAN DATA

Ini lahir berkat pengurusan teknologi maklumat yang berterusan, - ada pengarang berbeza yang bertanggung jawab untuk menerangkannya, jadi definisi yang paling penting yang telah dikenal pasti akan disebutkan.

"Perlombongan data pada awalnya dapat didefinisikan sebagai proses untuk menemukan hubungan, corak dan trend baru dan penting dengan memeriksa sejumlah besar data" (Pérez, C. & Santín, D., 2008)

Perlombongan data dianggap sebagai gabungan teknik separa automatik kecerdasan buatan, analisis statistik, pangkalan data dan visualisasi grafik, untuk mendapatkan maklumat yang tidak ditunjukkan secara eksplisit dalam data dan yang mungkin lebih berguna daripada data berlepas. (Martínez, E., 2000)

OBJEKTIF PERLOMBONGAN DATA

Oleh kerana adanya sejumlah besar maklumat dan kemajuan teknologi maklumat yang disebut, teknik khusus telah dihasilkan untuk analisis dan kawalannya.

Teknik-teknik ini mengusulkan untuk melakukan pengenalan yang tepat dari maklumat yang terkandung, yaitu, bukan hanya dengan cara tekstual, sebaliknya mereka menemukan corak dan tren maklumat, melalui alat yang berbeza seperti: algoritma, jaringan saraf, analisis data, untuk menyebutkan sebilangan (Pérez, C. & Santín, D., 2008)

Pengurusan data dan maklumat telah melalui fasa yang berbeza sepanjang sejarah, akhirnya mencapai perlombongan data, jadi perlu mempertimbangkan perwakilan berikut untuk memberikan idea yang lebih jelas mengenainya:

OPERASI PERLOMBONGAN DATA

Teknik ini mengenal pasti dan mengekstrak corak yang "memahami" data dan maklumat dengan secukupnya, mencapai ramalan tingkah laku.

Contoh yang jelas mengenai perlombongan data adalah apa yang disebut ETL (Pengekstrakan, Transformasi, Beban) dalam fasa-fasa tersebut adalah pembacaan data, penggabungan, transformasi, penyelenggaraan dan perancangan data, (Pérez, C. & Santín, D., 2008) model ini dikemukakan seperti berikut:

PERLOMBONGAN TEKS

Teknik ini didasarkan pada memperoleh atau mencari maklumat berguna pada item tertentu dari sejumlah maklumat yang umumnya ditambahkan dalam perisian khusus

Teknik ini memberi tumpuan kepada penemuan corak, tren dan perkaitan antara kepelbagaian maklumat yang ada. Perlombongan teks merangkumi bidang berikut:

  • Pengkategorian teks Pengelasan teks Penghasilan kelompok Penemuan persatuan Pengesanan penyimpangan Analisis trend Pembinaan ringkasan (Montes, M., s / f)

Proses perlombongan teks terbahagi kepada dua peringkat:

  • Pemprosesan yang pertama dipanggil. Di mana representasi teks dibuat dalam bentuk struktur dan panggilan penemuan lain. Di mana objektif yang akan dijelaskan dijelaskan seperti corak atau trend (Tan, 1999)

Secara umumnya, sistem yang dianggap sebagai perlombongan teks mempunyai perwakilan sederhana dan pengenalan beberapa kata kunci yang dianggap penting, yang memudahkan analisis dan penafsiran, sehingga dapat dikatakan bahawa perwakilannya dibatasi oleh tren yang telah ditetapkan.

APLIKASI PERLOMBONGAN TEKS

Perlombongan teks berlaku untuk pelbagai bidang, yang paling menonjol adalah:

  • Aspek keselamatan. Ini digunakan untuk memantau berbagai sumber maklumat, dan juga untuk kajian yang lebih terperinci mengenai kemungkinan ciphertext. Ini adalah aspek penyelidikan yang baru dikembangkan di mana pemprosesan bahasa semula jadi, pengkomputeran, bioinformatik, termasuk linguistik komputasi dianalisis. Fakta menganalisis hubungan yang dimiliki organisasi dengan pelanggan didedahkan, untuk mengelakkan kehilangan mereka Aplikasi akademik. Dalam banyak kasus, ketika menerbitkan berbagai artikel, permintaan pengindeksan, ini merujuk pada keberadaan kuantitas dan kualiti sisi tertentu, yang dibuat dengan cara yang sangat spesifik.

PERLOMBONGAN MERASA

Yang dikenali sebagai perlombongan sentimen adalah turunan dari perlombongan teks, dalam hal ini usaha dilakukan untuk mengenal pasti niat pelanggan atau pengguna di media yang berlainan, misalnya e-mel, Facebook, termasuk mesin carian yang berbeza dengan yang dimiliki oleh rangkaian.

Proses asas perlombongan data dilakukan seperti berikut:

  • Percubaan dibuat untuk memahami atau mengaitkan teks dengan item tertentu, misalnya dengan perniagaan, restoran, atau agensi pelancongan tertentu, setelah itu tujuan pelanggan dikenal pasti, meletakkan label pada frasa yang menjadikannya positif atau negatif, misalnya, jika kata "hebat" diklasifikasikan sebagai baik dalam pangkalan data, label positif ditambahkan, jika tidak, jika kata "buruk" diklasifikasikan sebagai buruk, label negatif akan ditambahkan.

Melalui analisis label ini organisasi mempunyai pengetahuan yang lebih besar mengenai pendapat dan penderitaan penggunanya. (Pérez, S., 2016)

ETIKA DALAM PENGGUNAAN PERLOMBONGAN

Maklumat yang dikendalikan dalam beberapa pangkalan data berasal dari pengguna, yang pada banyak kesempatan tidak sepenuhnya mengetahui bahawa organisasi yang berbeza akan menggunakannya untuk tujuan yang mereka anggap sesuai.

Pembelian, pembayaran, panggilan telefon elektronik, antara lain, adalah maklumat yang dihasilkan setiap hari dan dicatat dengan betul, masyarakat tidak mengetahui banyaknya maklumat yang dihasilkannya dan bahaya yang boleh ditimbulkannya (Garriga, A., 2004)

Berkat maklumat ini, perlombongan data menunjukkan jenis pengaruh yang dapat dijalin dengan masyarakat untuk memperoleh faedah tertentu.

Namun, tidak semuanya bertentangan dengan operasi perlombongan ini, teknologi ini menyokong organisasi untuk menjadikan pekerja mereka lebih cekap, menganalisis tingkah laku dan kemahiran mereka.

Walaupun dengan melacak penyemak imbas atau e-mel, ada kemungkinan untuk bertanya apakah seorang kolaborator sedang mencari peluang pekerjaan baru, atau jika dia menunjukkan tindakan yang membahayakan kegiatan syarikat itu sendiri, termasuk keganasan (Franganillo, J., 2010)

RUJUKAN BIBLIOGRAFI

  • Franganillo, J. (2010). Implicaciones éticas de la minería de datos. Anuario thinkEPI.Garriga, A. (2004). Tratamiento de datos personales y derechos fundamentales.Joyanes, L. (2013). Big Data: Análisis de los grandes volúmenes de datos en organizaciones (Primera). México D.F.: Alfaomega.Martínez, E. (2000). Minería de datos, una herramienta para la toma de decisiones. UNAM. Recuperado a partir de http://132.248.9.195/pd2001/287820/Index.htmlMontes, M. (s/f). Minería de texto: Un nuevo reto computacional. México D.F.: IPN. Recuperado a partir de http://ccc.inaoep.mx/~mmontesg/publicaciones/2001/MineriaTexto-md01.pdfPérez, C., & Santín, D. (2008). Minería de datos, técnicas y herramientas (Ediciones Paraninfo S.A.). España. Recuperado a partir de https://books.google.com.mx/books?id=wzD_8uPFCEC&printsec=frontcover&dq=miner%C3%ADa+de+datos&hl=es419&sa=X&sqi=2&redir_esc=y#v=onepage&q=miner%C3%ADa%20de%20datos&f=falsePérez, S. (2016). Análisis de sentimientos. Universidad Central de Venezuela.Tan. (1999). The state of the art and challenges, Proc. of the Workshop Knowledge Discovery from advanced Databases. text mining.
Muat turun fail asal

Perlombongan data, teks dan perasaan. data besar dalam organisasi