Proyek oreChem, didanai oleh Microsoft, kolaborasi antara beasiswa ilmu kimia dan informasi para ilmuan untuk mengembangkan dan meningkatkan infrastruktur, pelayanan dan aplikasi pendukung penelitian model terbaru dan menyebar luaskan informasi mengenai materi beasiswa dalam komunitas pembelajaran ilmu kimia. Walaupun fokus dari proyek ini dalam ilmu kimia, pekerjaannya lebih menekankan kepada pembangunan infrakstruktur pembangunan umum eScience, disamping itu menyanggupkan hubungan diantara para displin yang merupakan permintaan pemecahaan masalah ilmu pengetahuaan seperti pemanasan global. Aspek inti dari pekerjaan ini dan tujuan dari proyek ini adalah membuat dan mengimplementasikan cara beroprasinya infrakstruktur tersebut yang dapat membuat para beasiswa dalam ilmu kimia dapat berbagi mengunakan kembali manipulasi dan mengolah data yang berlokasi di tempat penyimpanan database dan pelayanan jaringan yang didistribusikan melalui jaringan.
Dasar dari perencanaan infrastruktur berdasarkan pengembangan spesifikasi bagian dari kegiatan OAI-ORE. Spesifikasi ini menyediakan model data dan kalimat yang bersambung untuk menggambarkan dan mengidentifikasi kumpulan sumber jaringan dan mengambarkan hubungan antara sumber yang terpilih. Spesifikasi OAI-ORE adalah dasar dari jaringan asitektur dan dasar-dasar dalam jaringan semantic dan usaha menyambungkan data. Koneksi relevan dari spesifikasi OAI-ORE kepada jaringan utama dan jaringan arsitektur semantic meliputi:
• Semua aspek data model ditampilkan dalam sumber, perwakilanURIs, dan triples.
• Entitas yang mendasar pada model data, penggabungan adalah sumber daya tanpa
perwakilan ("non-dokumen" sumber daya). Paradigma ini hampir sama dengan
dengan cara yang dimana dunia nyata atau konsep entitas termasuk dalam Web melalui
mekanisme yang diusulkan oleh Linked Data Usaha.
• Gambaran dari sebuah Penggabungan, Peta Sumber Daya, adalah suatu Sumber Daya yang terpisah, yang dapat diakses melalui URI dari Penggabungan dengan menggunakan mekanisme yang ditetapkan untuk URLs yang terkenal.
• Hasil dari akses HTTP yang berasal dari URLs Sumber Daya Peta yang merupakan serialisasi dari tiga kali lipat yang menggambarkan Penggabungan tersebut. Serialisasi ini terdapat dalam salah satu sintaks serialisasi OAI-ORE: RDF / XML, RDFa, dan Atom (tiga kali lipat dapat diekstraksi dari hal ini, melalui OAI-ORE yang didefinisikan dari tulisan XSLT GRDDL-compliant) .
Awal mereka bekerja di oreChem Project adalah mendesain model obyek berbasis grafik yang khusus untuk OAI-ORE data model untuk domain kimia. Model ini dibangun atas sentralitas dari molekul, atau senyawa kimia, dalam catatan beasiswa ilmu kimia. Di dalam sifat dasar yang berhubungan dengan inti database , molekul atau senyawa, yang diidentifikasi secara universal, yang membentuk pusat sentral untuk menghubungan dengan entitas lain seperti investigasi, eksperimen, sarjana, dan proses yang berkaitan dengan molekul itu.
Kemudian mereka menggunakan model ini untuk merancang interfaces dan APIs untuk bertukar informasi molekul dan hubungan mereka di antara gudang bagian distribusi, jasa, dan agen. Kemudian mereka menunjukkan infrastruktur ini dengan mengadaptasi beberapa repositori data yang ada kimia untuk APIs dan Model lainnya. Kemudian mereka juga lebih mengisi gudang ini dengan mengembangkan dan menyempurnakan teknik otomatis untuk retrospektif penggalian informasi kimia dan interlinking data kimia dari corpora kimia penelitian. Berikut ini mereka akan mengembangkan dan menyebarkan sejumlah alat, seperti pencarian struktur kimia, di atas gudang yang telah disesuaikan dengan infrastruktur. Dalam tahap terakhir dari proyek ini, mereka akan memperpanjang teknik ekstraksi data retrospektif dengan aktif "di laboratorium" mengambil data kimia, dan penambahan "dalam proses" data ke pengetahuan jaringan yang didefinisikan oleh model infrastruktur data.
Pada akhirnya, mererka membayangkan bahwa model data umum, protokol pertukaran, dan suite ekstraksi data dan alat data pengambilan akan memungkinkan eChemistry sebuah Web - grafik semantik dengan subgraphs yang melekat merupakan molekul yang kemudian saling berhubungan untuk publikasi yang mengacu pada mereka, eksperimen yang bekerja dengan mereka, dalam konteks dari penelitian, para peneliti bekerja sama dengan molekul-molekul, penjelasan tentang publikasi dan percobaan, dan sejenisnya. Sebuah aspek menarik dari grafik semantik adalah suatu cara di mana campuran data, artefak publikasi, dan orang-orang yang menyediakan jaringan sosial yang kaya informasi yang dibangun di sekitar pengertian tentang sosialitas objek pusat. Pada fase terakhir dari proyek, mereka berharap dapat membangun alat analisis yang inovatif yang akan menggali sesuatu yang terbaru dari "scientometric" informasi dan pengetahuan dari eChemistry Web.
Mereka bekerja di oreChem Proyek juga , khusus, mereka mendesain interoperabilitas yang berinfrastruktur, yang sedang dilakukan dengan penggunaan bahwa kimia, seperti disiplin yang ilmiah, bukan sebuah pulau, namun hubungan kompleks untuk beasiswa dalam disiplin lain dan ke dalam kegiatan yang terkait seperti pendidikan, dan kenyataannya dengan lingkungan informasi yang berbasis jaringan. Dengan mendasarkan pekerjaan mereka di OAI-ORE, mereka berharap bahwa paradigma interoperabilitas dirancang untuk oreChem akan hidup bersama dengan pekerjaan yang sama dalam disiplin yang lain dan bahkan dengan ruang informasi yang Web dan alat di mana-mana pencari, layanan, dan aplikasi.
by: Carl Lagoze. Information Science, Cornell University (lagoze@cs.cornell.edu)