Teoría BCM

La teoría BCM , la modificación sináptica BCM o la regla BCM , llamada así por Elie Bienenstock , Leon Cooper y Paul Munro, es una teoría física del aprendizaje en la corteza visual desarrollada en 1981. El modelo BCM propone un umbral deslizante para la potenciación a largo plazo (LTP) o depresión a largo plazo(LTD), y afirma que la plasticidad sináptica se estabiliza mediante una adaptación dinámica de la actividad postsináptica promediada en el tiempo. Según el modelo BCM, cuando se dispara una neurona presináptica, las neuronas postsinápticas tenderán a sufrir LTP si se encuentra en un estado de alta actividad (p. Ej., Se dispara a alta frecuencia y / o tiene altas concentraciones internas de calcio ), o LTD si se encuentra en un estado de menor actividad (p. ej., disparando a baja frecuencia, bajas concentraciones internas de calcio). ^[1] Esta teoría se usa a menudo para explicar cómo las neuronas corticales pueden someterse tanto a LTP como a LTD, dependiendo de los diferentes protocolos de estímulo de acondicionamiento aplicados a las neuronas presinápticas (generalmente estimulación de alta frecuencia, o HFS, para LTP, o estimulación de baja frecuencia, LFS, para LTD). ^[2]

Desarrollo

En 1949, Donald Hebb propuso un mecanismo de trabajo para la memoria y la adaptación computacional en el cerebro que ahora se llama aprendizaje hebbiano , o la máxima de que las células que disparan juntas, se conectan entre sí . ^[3] Esta noción es fundamental en la comprensión moderna del cerebro como una red neuronal y, aunque no es universalmente cierta, sigue siendo una buena primera aproximación respaldada por décadas de evidencia. ^[3]^[4]

Sin embargo, la regla de Hebb tiene problemas, a saber, que no tiene un mecanismo para que las conexiones se debiliten ni un límite superior para la fuerza que pueden alcanzar. En otras palabras, el modelo es inestable, tanto teórica como computacionalmente. Las modificaciones posteriores mejoraron gradualmente la regla de Hebb, normalizándola y permitiendo la desintegración de las sinapsis, donde ninguna actividad o actividad no sincronizada entre neuronas da como resultado una pérdida de fuerza de conexión. Nueva evidencia biológica llevó esta actividad a un pico en la década de 1970, donde los teóricos formalizaron varias aproximaciones en la teoría, como el uso de la frecuencia de disparo en lugar del potencial para determinar la excitación neuronal, y el supuesto de una integración sináptica ideal y, lo que es más importante, lineal. de señales. Es decir, no hay un comportamiento inesperado en la adición de corrientes de entrada para determinar si una celda se disparará o no.

Estas aproximaciones dieron como resultado la forma básica de BCM a continuación en 1979, pero el paso final llegó en forma de análisis matemático para probar la estabilidad y análisis computacional para probar la aplicabilidad, que culminó en el artículo de 1982 de Bienenstock, Cooper y Munro.

Desde entonces, los experimentos han mostrado evidencia del comportamiento de BCM tanto en la corteza visual como en el hipocampo , el último de los cuales juega un papel importante en la formación y almacenamiento de recuerdos. Ambas áreas están bien estudiadas experimentalmente, pero tanto la teoría como el experimento aún tienen que establecer un comportamiento sináptico concluyente en otras áreas del cerebro. Se ha propuesto que en el cerebelo , la sinapsis de la fibra paralela a la célula de Purkinje sigue una "regla de BCM inversa", lo que significa que en el momento de la activación de la fibra paralela, una alta concentración de calcio en la célula de Purkinje da como resultado LTD, mientras que una menor la concentración da como resultado LTP. ^[2] Además, la implementación biológica de la plasticidad sináptica en BCM aún no se ha establecido. ^[5]

Teoría

La regla básica de BCM toma la forma

{\ Displaystyle \, {\ frac {dm_ {j} (t)} {dt}} = \ phi ({\ textbf {c}} (t)) d_ {j} (t) - \ epsilon m_ {j} (t),}

dónde:

${\ Displaystyle m_ {j}}$ es el peso sináptico del ${\ Displaystyle j}$ la sinapsis,
${\ Displaystyle d_ {j}}$ es ${\ Displaystyle j}$ la corriente de entrada de la sinapsis,
${\ Displaystyle c (t) = {\ textbf {w}} (t) {\ textbf {d}} (t) = \ sum _ {j} w_ {j} (t) d_ {j} (t)}$ es el producto interno de los pesos y las corrientes de entrada (suma ponderada de las entradas),
${\ Displaystyle \ phi (c)}$ es una función no lineal. Esta función debe cambiar de signo en algún umbral ${\ Displaystyle \ theta _ {M}}$ , es decir, ${\ Displaystyle \ phi (c) <0}$ si y solo si ${\ Displaystyle c <\ theta _ {M}}$ . Consulte a continuación para obtener detalles y propiedades.
y ${\ Displaystyle \ epsilon}$ es la constante de tiempo (a menudo insignificante) de la desintegración uniforme de todas las sinapsis.

Este modelo es una forma modificada de la regla de aprendizaje hebbiana , ${\ Displaystyle {\ dot {m_ {j}}} = cd_ {j}}$ , y requiere una elección adecuada de la función de activación, o más bien, el umbral de salida, para evitar los problemas de inestabilidad de Hebb.

Bienenstock y col. ^[6] reescribir ${\ Displaystyle \ phi (c)}$ como una función ${\ Displaystyle \ phi (c, {\ bar {c}})}$ dónde ${\ Displaystyle {\ bar {c}}}$ es el tiempo promedio de ${\ Displaystyle c}$ . Con esta modificación y descartando la desintegración uniforme la regla toma la forma vectorial:

{\ Displaystyle {\ dot {\ mathbf {m}}} (t) = \ phi (c (t), {\ bar {c}} (t)) \ mathbf {d} (t)}

Las condiciones para el aprendizaje estable se derivan rigurosamente en BCM señalando que con ${\ Displaystyle c (t) = {\ textbf {m}} (t) \ cdot {\ textbf {d}} (t)}$ y con la aproximación de la producción media ${\ Displaystyle {\ bar {c}} (t) \ approx {\ textbf {m}} (t) {\ bar {\ mathbf {d}}}}$ , es suficiente que

{\ Displaystyle \, \ operatorname {sgn} \ phi (c, {\ bar {c}}) = \ operatorname {sgn} \ left (c- \ left ({\ frac {\ bar {c}} {c_ { 0}}} \ right) ^ {p} {\ bar {c}} \ right) ~~ {\ textrm {para}} ~ c> 0, ~ {\ textrm {y}}}

{\ Displaystyle \, \ phi (0, {\ bar {c}}) = 0 ~~ {\ textrm {for}} ~ {\ textrm {all}} ~ {\ bar {c}},}

o equivalentemente, que el umbral ${\ Displaystyle \ theta _ {M} ({\ bar {c}}) = ({\ bar {c}} / c_ {0}) ^ {p} {\ bar {c}}}$ , dónde ${\ Displaystyle p}$ y ${\ Displaystyle c_ {0}}$ son constantes positivas fijas. ^[6]

Cuando se implementa, la teoría a menudo se toma de tal manera que

{\ Displaystyle \, \ phi (c, {\ bar {c}}) = c (c- \ theta _ {M}) ~~~ {\ textrm {y}} ~~~ \ theta _ {M} = \ langle c ^ {2} \ rangle = {\ frac {1} {\ tau}} \ int _ {- \ infty} ^ {t} c ^ {2} (t ^ {\ prime}) e ^ {- (tt ^ {\ prime}) / \ tau} dt ^ {\ prime},}

donde los paréntesis angulares son un promedio de tiempo y ${\ Displaystyle \ tau}$ es la constante de tiempo de la selectividad.

El modelo tiene inconvenientes, ya que requiere tanto potenciación a largo plazo y depresión a largo plazo , o aumentos y disminuciones en la fuerza sináptica, algo que no se ha observado en todos los sistemas corticales. Además, requiere un umbral de activación variable y depende en gran medida de la estabilidad de los puntos fijos seleccionados ${\ Displaystyle c_ {0}}$ y ${\ Displaystyle p}$ . Sin embargo, la fortaleza del modelo es que incorpora todos estos requisitos de reglas de estabilidad derivadas de forma independiente, como la normalización y una función de decaimiento con tiempo proporcional al cuadrado de la salida. ^[7]

Ejemplo

Este ejemplo es un caso particular del del capítulo "Resultados matemáticos" de Bienenstock et al. ^[6] trabajo, asumiendo ${\ Displaystyle p = 2}$ y ${\ Displaystyle c_ {0} = 1}$ y dos entradas ortogonales. Con estos valores ${\ Displaystyle \ phi (c, {\ bar {c}}) = c - {\ bar {c}} ^ {2}}$ y la neurona hipotética tendrá dos sinapsis ${\ Displaystyle \ mathbf {d} = (d_ {1}, d_ {2})}$ , la mitad del tiempo estas sinapsis muestran una actividad de ${\ Displaystyle (1,0)}$ , resto del tiempo ${\ Displaystyle (0,1)}$ . El tiempo promedio de las entradas es ${\ Displaystyle \ mathbf {\ bar {d}} = (0.5,0.5)}$ .

Si los pesos iniciales son ${\ Displaystyle \ mathbf {m} = (0.6,0.8)}$ la suma ponderada ${\ Displaystyle c}$ cuando la primera sinapsis está activa es igual a 0,6, el resto del tiempo es 0,8, lo que significa un promedio ${\ displaystyle {\ bar {c}} = 0,7}$ . Valores para ${\ Displaystyle \ phi}$ es igual a 0.11 y 0.31 respectivamente, mismo valor para derivadas de los pesos, siendo nuevos ${\ Displaystyle \ mathbf {m} = (0,66,0.96)}$ .

Repitiendo el paso anterior encontramos:

${\ Displaystyle m_ {1}}$	${\ Displaystyle m_ {2}}$
0,60	0,80
0,66	0,96
0,66	1,11
0,60	1,27
0,46	1,47
0,22	1,74
0,00	2.13
0,00	2,63
0,00	3,08
0,00	3,43
0,00	3,68
0,00	3,83
0,00	3,91
0,00	3,95
0,00	3,98
0,00	3,99
0,00	3,99
0,00	4,00
0,00	4,00
0,00	4,00

Como se puede ver en la tabla anterior, los valores estables finales de los pesos son ${\ Displaystyle m_ {1} = 0}$ y ${\ Displaystyle m_ {2} = 4}$ .

Experimentar

La primera gran confirmación experimental de BCM se produjo en 1992 al investigar LTP y LTD en el hipocampo . Los datos mostraron un acuerdo cualitativo con la forma final de la función de activación BCM. ^[8] Este experimento se replicó más tarde en la corteza visual , que BCM fue diseñado originalmente para modelar. ^[9] Este trabajo proporcionó más evidencia de la necesidad de una función de umbral variable para la estabilidad en el aprendizaje de tipo hebbiano (BCM u otros).

La evidencia experimental no ha sido específica de BCM hasta que Rittenhouse et al. confirmó la predicción de BCM de la modificación de la sinapsis en la corteza visual cuando un ojo se cierra selectivamente. Específicamente,

{\ Displaystyle \ log \ left ({\ frac {m _ {\ rm {cerrado}} (t)} {m _ {\ rm {cerrado}} (0)}} \ right) \ sim - {\ overline {n ^ {2}}} t,}

dónde ${\ Displaystyle {\ overline {n ^ {2}}}}$ describe la variación en la actividad espontánea o el ruido en el ojo cerrado y ${\ Displaystyle t}$ es el tiempo desde el cierre. El experimento estuvo de acuerdo con la forma general de esta predicción y proporcionó una explicación de la dinámica del cierre ocular monocular ( privación monocular ) frente al cierre ocular binocular. ^[10] Los resultados experimentales están lejos de ser concluyentes, pero hasta ahora han favorecido al BCM sobre las teorías de la plasticidad que compiten entre sí.

Aplicaciones

Si bien el algoritmo de BCM es demasiado complicado para el procesamiento distribuido en paralelo a gran escala , se ha utilizado en redes laterales con cierto éxito. ^[11] Además, algunos algoritmos de aprendizaje de redes computacionales existentes se han hecho para corresponder al aprendizaje BCM. ^[12]

Referencias

↑ Izhikevich, Eugene M .; Desai, Niraj S. (1 de julio de 2003). "Relacionando STDP con BCM". Computación neuronal . 15 (7): 1511-1523. doi : 10.1162 / 089976603321891783 . ISSN 0899-7667 . PMID 12816564 . S2CID 1919612 .
^ ^a ^b Coesmans, Michiel; Weber, John T .; Zeeuw, Chris I. De; Hansel, Christian (2004). "Plasticidad bidireccional de fibras paralelas en el cerebelo bajo control de fibras trepadoras". Neurona . 44 (4): 691–700. doi : 10.1016 / j.neuron.2004.10.031 . PMID 15541316 . S2CID 9061314 .
^ a b Principios de la ciencia neuronal . Kandel, Eric R. (5ª ed.). Nueva York. 2013. ISBN 978-0-07-139011-8. OCLC 795553723 .CS1 maint: otros ( enlace )
^ Markram, Henry; Gerstner, Wulfram ; Sjöström, Per Jesper (2012). "Plasticidad dependiente del tiempo de pico: una descripción completa" . Fronteras en neurociencia sináptica . 4 : 2. doi : 10.3389 / fnsyn.2012.00002 . ISSN 1663-3563 . PMC 3395004 . PMID 22807913 .
^ Cooper, LN (2000). "Memorias y memoria: el enfoque de un físico al cerebro" (PDF) . International Journal of Modern Physics A . 15 (26): 4069–4082. doi : 10.1142 / s0217751x0000272x . Consultado el 11 de noviembre de 2007 .
^ a b c Bienenstock, Elie L .; Leon Cooper ; Paul Munro (enero de 1982). "Teoría para el desarrollo de la selectividad neuronal: especificidad de orientación e interacción binocular en la corteza visual" (PDF) . La Revista de Neurociencia . 2 (1): 32–48. doi : 10.1523 / JNEUROSCI.02-01-00032.1982 . PMC 6564292 . PMID 7054394 . Consultado el 11 de noviembre de 2007 .
^ Intrator, Nathan (2006-2007). "La teoría BCM de la plasticidad sináptica" . Computación neuronal . Facultad de Ciencias de la Computación, Universidad de Tel-Aviv . Consultado el 11 de noviembre de 2007 .
^ Dudek, Serena M .; Mark Bear (1992). "Depresión homosináptica a largo plazo en el área CA1 del hipocampo y efectos del bloqueo del receptor de N-metil-D-aspartato" (PDF) . Proc. Natl. Acad. Sci . 89 (10): 4363–4367. Código Bibliográfico : 1992PNAS ... 89.4363D . doi : 10.1073 / pnas.89.10.4363 . PMC 49082 . PMID 1350090 . Consultado el 11 de noviembre de 2007 .
^ Kirkwood, Alfredo ; Marc G. Rioult ; Mark F. Bear (1996). "Modificación dependiente de la experiencia de la plasticidad sináptica en la corteza visual de la rata". Naturaleza . 381 (6582): 526–528. Código Bibliográfico : 1996Natur.381..526K . doi : 10.1038 / 381526a0 . PMID 8632826 . S2CID 2705694 .
^ Rittenhouse, Cynthia D .; Harel Z. Shouval; Michael A. Paradiso; Mark F. Bear (1999). "La privación monocular induce depresión homosináptica a largo plazo en la corteza visual". Naturaleza . 397 (6717): 347–50. Código Bibliográfico : 1999Natur.397..347R . doi : 10.1038 / 16922 . PMID 9950426 . S2CID 4302032 .
^ Intrator, Nathan (2006-2007). "Regla de aprendizaje de BCM, problemas de compensación" (PDF) . Computación neuronal . Facultad de Ciencias de la Computación, Universidad de Tel-Aviv . Consultado el 11 de noviembre de 2007 .
^ Baras, Dorit; Ron Meir (2007). "Aprendizaje por refuerzo, plasticidad dependiente del tiempo de pico y la regla BCM" (PDF) . Computación neuronal . 19 (8): 2245–2279. CiteSeerX 10.1.1.119.395 . doi : 10.1162 / neco.2007.19.8.2245 . PMID 17571943 . S2CID 40872097 . 2561. Archivado desde el original (PDF) el 21 de julio de 2011 . Consultado el 11 de noviembre de 2007 .

enlaces externos

Artículo de Scholarpedia

[1] Izhikevich, Eugene M .; Desai, Niraj S. (1 de julio de 2003). "Relacionando STDP con BCM". Computación neuronal . 15 (7): 1511-1523. doi : 10.1162 / 089976603321891783 . ISSN 0899-7667 . PMID 12816564 . S2CID 1919612 .

[:0-2] Coesmans, Michiel; Weber, John T .; Zeeuw, Chris I. De; Hansel, Christian (2004). "Plasticidad bidireccional de fibras paralelas en el cerebelo bajo control de fibras trepadoras". Neurona . 44 (4): 691–700. doi : 10.1016 / j.neuron.2004.10.031 . PMID 15541316 . S2CID 9061314 .

[:1-3] Principios de la ciencia neuronal . Kandel, Eric R. (5ª ed.). Nueva York. 2013. ISBN 978-0-07-139011-8. OCLC 795553723 .CS1 maint: otros ( enlace )

[4] Markram, Henry; Gerstner, Wulfram ; Sjöström, Per Jesper (2012). "Plasticidad dependiente del tiempo de pico: una descripción completa" . Fronteras en neurociencia sináptica . 4 : 2. doi : 10.3389 / fnsyn.2012.00002 . ISSN 1663-3563 . PMC 3395004 . PMID 22807913 .

[5] Cooper, LN (2000). "Memorias y memoria: el enfoque de un físico al cerebro" (PDF) . International Journal of Modern Physics A . 15 (26): 4069–4082. doi : 10.1142 / s0217751x0000272x . Consultado el 11 de noviembre de 2007 .

[:2-6] Bienenstock, Elie L .; Leon Cooper ; Paul Munro (enero de 1982). "Teoría para el desarrollo de la selectividad neuronal: especificidad de orientación e interacción binocular en la corteza visual" (PDF) . La Revista de Neurociencia . 2 (1): 32–48. doi : 10.1523 / JNEUROSCI.02-01-00032.1982 . PMC 6564292 . PMID 7054394 . Consultado el 11 de noviembre de 2007 .

[7] Intrator, Nathan (2006-2007). "La teoría BCM de la plasticidad sináptica" . Computación neuronal . Facultad de Ciencias de la Computación, Universidad de Tel-Aviv . Consultado el 11 de noviembre de 2007 .

[8] Dudek, Serena M .; Mark Bear (1992). "Depresión homosináptica a largo plazo en el área CA1 del hipocampo y efectos del bloqueo del receptor de N-metil-D-aspartato" (PDF) . Proc. Natl. Acad. Sci . 89 (10): 4363–4367. Código Bibliográfico : 1992PNAS ... 89.4363D . doi : 10.1073 / pnas.89.10.4363 . PMC 49082 . PMID 1350090 . Consultado el 11 de noviembre de 2007 .

[9] Kirkwood, Alfredo ; Marc G. Rioult ; Mark F. Bear (1996). "Modificación dependiente de la experiencia de la plasticidad sináptica en la corteza visual de la rata". Naturaleza . 381 (6582): 526–528. Código Bibliográfico : 1996Natur.381..526K . doi : 10.1038 / 381526a0 . PMID 8632826 . S2CID 2705694 .

[10] Rittenhouse, Cynthia D .; Harel Z. Shouval; Michael A. Paradiso; Mark F. Bear (1999). "La privación monocular induce depresión homosináptica a largo plazo en la corteza visual". Naturaleza . 397 (6717): 347–50. Código Bibliográfico : 1999Natur.397..347R . doi : 10.1038 / 16922 . PMID 9950426 . S2CID 4302032 .

[11] Intrator, Nathan (2006-2007). "Regla de aprendizaje de BCM, problemas de compensación" (PDF) . Computación neuronal . Facultad de Ciencias de la Computación, Universidad de Tel-Aviv . Consultado el 11 de noviembre de 2007 .

[12] Baras, Dorit; Ron Meir (2007). "Aprendizaje por refuerzo, plasticidad dependiente del tiempo de pico y la regla BCM" (PDF) . Computación neuronal . 19 (8): 2245–2279. CiteSeerX 10.1.1.119.395 . doi : 10.1162 / neco.2007.19.8.2245 . PMID 17571943 . S2CID 40872097 . 2561. Archivado desde el original (PDF) el 21 de julio de 2011 . Consultado el 11 de noviembre de 2007 .

[1]