De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

WikiProject Chemicals y WikiProject Pharmacology están validando el contenido en los infoboxes {{ chembox }} y {{ drugbox }}. Los valores en el cuadro de información se comparan con los valores informados en la literatura, y cuando los valores coinciden, la revisión actual se almacena en el índice de chembox y el índice de cuadro de medicamentos, respectivamente. Por lo general, esto se hace para valores que son 'inmutables' (por ejemplo, el punto de ebullición de un compuesto químico: el punto de ebullición del agua en condiciones estándar es 99,98 ° C y no hay ninguna razón plausible para sospechar que cambiará).

En este momento, estamos verificando el número de registro CAS ('CASNo' en el {{ chembox }}, 'CAS_number' en el {{ drugbox }}), ChemSpider ID (ChemSpiderID), Unique Ingredient Identifier (UNII), InChI , KEGG y ChEMBL en comparación con los datos de http://commonchemistry.org (el sitio web de CAS), http://www.chemspider.com y http://fdasis.nlm.nih.gov/srs/srs.jsp(para la UNII), así como de listas proporcionadas por (número CAS, ChemSpiderID, InChI, UNII, ChEMBL y ChEBI) o descargadas de estos sitios web (KEGG, DrugBank). Mientras tanto, estamos tratando de agregar, actualizar y / o verificar otros identificadores (InChI, InChIKey) comparando los datos con el sitio web de ChemSpider http://www.chemspider.com .

CheMoBot está siguiendo los cambios en estos artículos y está configurado para actualizar los infoboxes. Cuando detecta cambios en los valores, cambiará los parámetros en el cuadro de información en consecuencia. La plantilla utiliza estos parámetros para mostrar cuál es el estado de los campos en el cuadro.

Los cuadros que contienen valores verificados que son los mismos que los valores en la revisión verificada están etiquetados con chequeYen la parte inferior, y los cuadros donde se cambian algunos de estos valores están etiquetados con ☒norte. Además, los identificadores individuales también están etiquetados con chequeYo ☒norte. Si las casillas contienen cambios en estos campos verificados, también se clasifican en Categoría: Chemboxes que contienen cambios en los campos verificados . Los cuadros que contienen cambios en otros campos importantes se clasifican en Categoría: Chemboxes que contienen cambios en los campos observados . Por ejemplo, vea este vandalismo , rápidamente marcado por CheMoBot .

Si encuentra una página con un {{ chembox }} o {{ drugbox }} que muestra un ☒norte, verifique si el valor actual es incorrecto (en cuyo caso, puede volver a cambiarlo al valor en la revisión verificada; el bot hará el resto), o si hay un error en la revisión verificada (si es así, es posible que necesite una actualización del índice; si necesita ayuda con eso, pregunte al wikiproject correspondiente).

Verificación: etiquetado de referencias

CheMoBot agrega una plantilla a un parámetro _Ref (por ejemplo, para CASNo, se completará CASNo_Ref ) cuando el bot encuentra el campo correcto. El primer parámetro de la plantilla es 'correcto' o 'cambiado', y la casilla mostrará una marca o una cruz en consecuencia en CASNo. El segundo parámetro es un campo que contiene una referencia para 'dónde' se verificó el parámetro. Como en este momento estamos verificando todos los campos con el sitio CAS commonchemistry.org, el bot reemplaza XXX con 'CAS' (es decir, ). Cuando utilice otro lugar para verificar el CASNo, adapte este parámetro en consecuencia e intentará conservar este campo en todo momento. Cuando haya muchas más verificaciones en lugares que no sean commonchemistry.org,Le daré instrucciones al bot para que complete el campo estándar con o algo similar.{{cascite|correct|XXX}}{{cascite|correct|CAS}}{{cascite|correct|??}}

Método de trabajo

Nuestro enfoque es comenzar verificando que el número de registro CAS y la estructura coincidan con el nombre. Esto se utilizará como base sobre la cual podemos construir un esfuerzo de validación más amplio. Una vez que tenemos la estructura verificada, tenemos la fórmula, y por ende la masa molar, y también podemos generar otras representaciones de máquinas como SMILES, InChI e InChIKey.

Primeros 1000

Después de nuestra reunión de IRC el 13 de enero de 2009 , usamos un archivo de Excel para validar las primeras 1000 entradas del archivo XML de CAS. Esto está disponible para los miembros del proyecto aquí , en el sitio protegido por contraseña. Mientras tanto, User: Physchim62 validó los inorgánicos por separado, y estos se pueden encontrar en el archivo CAVer .

La obra

Ahora estamos comenzando a trabajar en la lista de "artículos problemáticos" encontrados por Usuario: Beetstra, y enumerados en Usuario: Beetstra / CASFoundCorrect . Pronto se agregará una descripción del proceso.

Notas

  • Se utilizan diferentes números CAS para cada forma de sustancia. Por ejemplo, algo simple como alanina tendrá un CAS # para la forma D, otro para L, otro para "no especificado" y un cuarto para racémico. Habría otros cuatro números CAS para el clorhidrato, cuatro para el sulfato (1: 1), cuatro para el sulfato (2: 1), etc. ¡Es muy importante que hagamos coincidir el número CAS correcto con nuestras Chemboxes!
  • Tenga en cuenta que CAS utiliza un sistema inusual para representar algunas fórmulas, que pueden parecernos "incorrectos". Estos implican describir sales como el nitrato de sodio como HNO 3 · Na, y las sales orgánicas siguen un sistema similar. No use tales fórmulas en WP, pero no son "incorrectas" ya que son simplemente una representación, no una estructura formal. Esto también da como resultado un MolarMass incorrecto en la sección FW del archivo SDF para sales.
  • Para estructuras quirales complejas, como la bleomicina , que pueden dibujarse de manera muy diferente en WP que en Common Chemistry, encontré que era mejor asignar R / S para cada centro y comparar de esa manera. (¡Y sí, Farseer dibujó bleomicina perfectamente!)
  • El número de CAS en un Chembox recibirá una marca verde (marca de verificación) una vez que se agregue {{ cascite }}. Esto aún no sucede en el Drugbox (no hay cambios en este momento), pero esperamos habilitar un sistema similar allí también, si WP: PHARM está de acuerdo.

Campos para verificar / cargar

Chemboxes

Verificar estructura, no CAS, fórmula, MolarMass.

Notas:

  • 1. el bot 'divide' los campos en dos conjuntos, vigilados y no vigilados; se informan todos los cambios, pero los campos observados son los que realmente queremos cuidar, esos son los campos que contienen datos incondicionales y verificables que es muy poco probable que cambien (como el punto de ebullición del agua , el número CAS de benceno , la cantidad de carbonos en la glucosa . Nota: es posible que sea necesario actualizar la lista de campos "observados"
  • 2. El bot considera un campo vacío como "desconocido". Informará los cambios en este campo, pero le asignará un "nivel de advertencia" más bajo.
  • 3. Las cosas entre <! - y -> son 'comentarios', se pueden guardar y aparecer en el cuadro de edición, pero no producen wikicode visible.
  • Cuando aparezca una versión "mejor" de una página, cambie el número en la página. Si hay dos revids para la misma página, se usa el más cercano a la parte inferior de la página de índice (la página se analiza de arriba a abajo, reemplazando los valores si ocurren duplicados).

Los trabajadores

Regístrese para trabajar en algunos de los artículos enumerados en Usuario: Beetstra / CASFoundCorrect . Más información más adelante.

  • 1–1000 Walkerma ( charla ) 22:48, 3 de noviembre de 2009 (UTC)
  • 1001-2000 Ambix ( conversación ) 17:57, 17 de noviembre de 2009 (UTC)
  • 2001–3000 ɯɐɔ ( conversación ) 07:12, 21 de diciembre de 2016 (UTC)
  • 3001–4000 ɯɐɔ ( conversación ) 07:12, 21 de diciembre de 2016 (UTC)
  • 4001–5000 ɯɐɔ ( conversación ) 07:12, 21 de diciembre de 2016 (UTC)
  • 5001 – end ɯɐɔ ( conversación ) 07:12, 21 de diciembre de 2016 (UTC)

El software

Problemas encontrados al validar el archivo de Excel

Por favor anote aquí cualquier entrada "para ser revisada".

1–100

101-200

201–300

  • El centro quiral Kanamycin One parece no coincidir con CAS. ¿Existen múltiples formas de esto? Estructura dice Kanamycin A.
    • Sí, hay múltiples formas (A, B, C, D, X) y varias derivadas, pero la diferencia está en las cadenas laterales. Fvasconcellos  ( t · c ) 11:48, 10 de febrero de 2009 (UTC)
  • Tocoferol Un centro quiral parece no coincidir, ¿múltiples formas? a-tocoferol, CAS simplemente dice tocoferol.
Hay varios isómeros. Archivo: RRR alpha-tocoferol.png muestra el isómero más común. Tim Vickers ( charla ) 04:28, 10 de septiembre de 2009 (UTC)
  • Ion parental acetilcolina , cuadro de información no chembox.
  • Linoleic_acid WP dice cis, cis, CAS dice trans trans 'ácido linoelaídico', todo el mundo dice que el ácido linoleico es 60-33-3, incluida la hoja de cálculo y sigma.
    • 60-33-3 parece referirse a all- cis . Fvasconcellos  ( t · c ) 11:52, 10 de febrero de 2009 (UTC)
      • Esto es muy extraño, es trans, trans en el archivo de unión y cis, cis en el archivo de wikichem (he estado usando el archivo de unión para verificar los números CAS). Necesito investigar esto. Ambix ( charla ) 12:47, 12 de febrero de 2009 (UTC)
  • Glucosa 1-fosfato No se especifica un centro quiral (debe coincidir con CAS). (¿probablemente como resultado de copiar el esqueleto de glucosa, en el que este átomo no es quiral?).
    • Ver anómero . Es probable que ambas formas (alfa y beta-glucopiranósido) estén descritas por este número CAS. - Tweenk ( conversación ) 21:41, 15 de noviembre de 2009 (UTC)
  • Streptomycin 57-92-1 Parece ser una imagen especular de la estructura WP.
  • Tubocurarina 57-94-3 y 57-95-4 estructura está en mal estado en el archivo de la unión. No puedo encontrarle sentido.

301–400

  • Cefalosporina Sin chembox y otros problemas.
    • Este es un artículo de clase, no creo que deba haber un chembox. Fvasconcellos  ( t · c ) 19:54, 24 de enero de 2009 (UTC)
    • El CASRN se refiere a la cefalosporina C , para la cual parece que no tenemos un artículo. Physchim62 (charla) 20:19, 25 de enero de 2009 (UTC)
  • Lactosa CAS es para forma de aldehído de cadena abierta, ¿es esto significativo?
    • No lo creo, pero lo estamos comprobando. Physchim62 (charla) 22:35, 23 de enero de 2009 (UTC)
  • Problemas quirales de metionina .
    • según la página de charla Physchim62 (charla) 22:35, 23 de enero de 2009 (UTC)
  • Evans_blue KEGG está marcado como incorrecto pero es correcto en el valor actual de C19422. http://www.kegg.jp/entry/C19422

401–500

  • Colecalciferol : el diagrama de estructura tiene un átomo de carbono con dos enlaces en cuña unidos, lo que dificulta la verificación (la estereoquímica debería ser R aquí, y creo que lo es)
  • Vitamina B12 : el diagrama de estructura no especifica adecuadamente la estereoquímica del anillo de Corrin
  • Reactivo de Ellman : sin chembox y necesita limpieza de texto
    • Agregué un chembox. - Ed ( Edgar181 ) 19:12, 11 de febrero de 2009 (UTC)
  • Reactivo de Sanger : sin chembox
  • Asparagina : el diagrama de estructura tiene un átomo de carbono con dos enlaces en cuña unidos, lo que dificulta la verificación (la estereoquímica debe ser S aquí, y es)
  • Histidina : la estructura debe mostrar estereoquímica
  • Acetato de medroxiprogesterona : redirecciona a medroxiprogesterona
  • Veratridina : aún por verificar, la estructura se muestra mal en ChemFileBrowser
  • Lactato de sodio : Chembox de estilo antiguo; tenga en cuenta que CASRN es para estereoquímica no especificada
  • Valina : el diagrama de estructura tiene un átomo de carbono con dos enlaces en cuña unidos, lo que dificulta la verificación (la estereoquímica debe ser S aquí, y es)
  • Treonina : el diagrama de estructura no especifica la estereoquímica en los dos centros quirales (debe ser 2 S , 3 R )
  • Endrina : El diagrama de estructura parece mostrar el endo- isómero mientras que el CASRN es para el exo -isómero (o viceversa, ¡nunca fui muy bueno en esta nomenclatura particular! En cualquier caso, ¡no es el mismo compuesto!). debe volver a comprobar con Dieldrin (CASRN [60-57-1]) también. Ninguno de los compuestos tiene la estereoquímica correctamente especificada.
    • Volví a verificar el Dieldrin, agregué los hidrógenos implícitos a la estructura de WP y dibujé en chemsketch, también copié la estructura CAS exactamente e hice que el programa asignara etiquetas estéreo. Coinciden, lo que me lleva a pensar que mi verificación inicial está bien. Quizás debería tenerse en cuenta que, si bien los esqueletos de carbono parecen tener la misma proyección, WP es desde arriba y CAS (resulta ser) desde abajo. Si aún no está satisfecho, ¿podría describir su asignación con más detalle? Probaré el método chemsketch con Endrin y espero que podamos comparar notas Ambix ( charla ) 23:27, 6 de febrero de 2009 (UTC)
    • He comprobado Endrin con el mismo proceso y no coincide. Hay una versión anterior de esta imagen Endrin.png y esta coincide. Dadas las dificultades de transponer una estructura 3D a una forma más convencional, probablemente sería mejor tener una estructura más convencional también para compuestos como este, pero sugeriría que evitemos eliminar estructuras 3D siempre que sea posible validarlas. Investigaré más.
      • Sugiero que para nuestra estructura validada en tales compuestos, deberíamos mostrar explícitamente la estereoquímica de cada centro quiral, que no es el caso en la actualidad en Endrin y Dieldrin (incluso si un químico experto puede averiguar cuál debe ser a partir del diagrama) . Eso no significa necesariamente cambiar las estructuras en los chemboxes (nuestras imágenes para inorgánicos no siempre dan una idea clara de la estructura), pero debemos insistir en que la información del chembox sea correcta y no engañosa, y que todos los detalles estará disponible en el artículo (tal vez en una imagen separada). Physchim62 (charla) 23:23, 9 de febrero de 2009 (UTC)
  • Diclorodifenildicloroetileno : chembox de forma corta
  • Azul tripán : el diagrama de estructura muestra el ácido libre, mientras que CASRN es para la sal tetrasódica
  • Isoleucina : el diagrama de estructura no especifica la estereoquímica en los dos centros quirales (debe ser 2 S , 3 S )
  • Etambutol : el diagrama de estructura no especifica la estereoquímica en los dos centros quirales (debe ser 2 S , 2 ' S )
    • Hecho. Fvasconcellos  ( t · c ) 23:42, 9 de febrero de 2009 (UTC)
  • Arginina : la estructura debe mostrar estereoquímica
  • Etileno : chembox de estilo antiguo
  • Artículos faltantes: 3,5-dimetilpirazol , O-metilhidroxilamina , yoduro de tetraetilamonio , 3-bromopiruvato de etilo , 1-metil-3-nitro-1-nitrosoguanidina , ácido mercaptosuccínico , p-toluenosulfonamida , ácido 4-clorobenzoico , N, N, N Difenil-1,4-fenilendiamina
  • Iones: acetato , bicarbonato

501–600

  • El trimetilaluminio es dímero, CAS es monómero. ¿Es esto significativo, CAS tendrá un dímero en la lista?
  • Alcanfor Tanto la página WP como el CAS son para estereoisómeros no especificados; sin embargo, si seguimos la regla de origen natural, ¿debería cambiarse la página WP por el isómero natural y el CAS no especificado debe relegarse a "otro"?

601–700

  • Aprobarbital CAS 77-02-1 no está especificado.
  • El 2,3-dimetilbutano redirige a dimetilbutano, solo 2,2 tiene un artículo. El nombre genérico ahora es DAB, tanto 2,2 como 2,3 tienen artículos.

701–800

801–900

901–1000

Inorgánicos

Los 677 "inorgánicos" (compuestos neutros sin enlaces C – C o C – H) ya se han verificado. 496 entradas dieron una coincidencia perfecta, 74 entradas tenían algún tipo de problema en el artículo (a menudo menor y ya arreglado) y 100 entradas no tenían un artículo correspondiente en Wikipedia. Un informe completo estará disponible a su debido tiempo.

Elementos e iones

Estos requerirán un tratamiento especial: comuníquese con Physchim62 para obtener más detalles.