Epoch3 se lanzó oficialmente el 7 de junio de 2025, introduciendo cambios importantes en el protocolo, incluidos mejoras tecnológicas, un nuevo mecanismo de staking y cambios operativos.
Kuzco ha realizado una actualización de marca, ahora se llama Inference.
La inversión de Multicoin Capital en este proyecto es cierta.
Se han elevado los umbrales de los dispositivos
Lanzar un mecanismo de minería de staking similar al de io.net
Revisión de Epoch2
Recomendación de configuración para participar
Se recomienda revisar los artículos anteriores antes de leer:
Guía práctica de a16z "Discípulo" Kuzco: ¿Cómo realizar la minería de potencia de AI de manera eficiente?
Guía práctica de a16z "Discípulo" Kuzco II: De la guerra individual al despliegue colectivo
Multicoin Capital entra en acción
En diciembre del año pasado, Sam, el fundador de Inference, afirmó en el canal de mineros de oro de DC oficial que el proyecto había recibido una financiación de 11.5 millones de dólares de Multicoin Capital y a16z csx. Esta noticia fue confirmada recientemente, y el proyecto se puede ver en la lista de cartera de Multicoin Capital. Es cierto que Inference recibió inversión de Multicoin Capital. (Multicoin Capital también fue un inversor temprano en io.net)
Epoch 3 inicial
Desde el lanzamiento de Epoch3 el 7 de junio de 2025, la red ha estado en funcionamiento durante 10 días. En comparación con las dos fases anteriores, el número de mineros participantes ha aumentado notablemente, así como el volumen de inferencias y la estabilidad de la red. Hasta el momento de escribir, el número de trabajadores ha alcanzado 12,100; aunque en términos numéricos aún no ha superado el valor máximo de 14,000 de Epoch1. Sin embargo, Epoch3 ha limitado las tarjetas gráficas de bajo rendimiento y las instancias múltiples, por lo que se puede inferir razonablemente que el número de participantes es varias veces mayor que en las primeras etapas.
¿Qué cambios trae la Época 3?
Actualización automática de nodos
La función de actualización automática de nodos puede reducir significativamente la carga operativa de los mineros. Después de experimentar con Epoch 1&2, la oficial actualiza los archivos de manera irregular y las notificaciones de actualización no son oportunas. Esto provoca que muchos usuarios terminen sus procesos, pensando que hay un problema con el dispositivo, y pasan mucho tiempo tratando de resolverlo, cuando en realidad la razón es que los usuarios no han actualizado a tiempo.
Gestión del motor de inferencia unificado
El autor ha ejecutado el modelo Llama-3.1-8B de Meta en ambas ocasiones y no ha encontrado los modelos que se indican en la documentación oficial como seleccionables. Esto es cuestionable. Además, si es posible elegir, es preferible optar por modelos con mayor tasa de uso, ya que generan una mayor cantidad de inferencias y se obtienen puntuaciones más altas.
Detección y verificación mejoradas de GPU
Inference anunció que iba a eliminar de forma obligatoria las tarjetas gráficas con potencia de cálculo inferior a RTX 3080 desde la Época 2, probablemente por temor a la insatisfacción de la comunidad, por lo que no se ha ejecutado hasta el final de la Época 2. Aún se puede ver que hay una gran cantidad de tarjetas gráficas con potencia de cálculo insuficiente, como 3060, 3070, participando en la inferencia. El autor considera que los dispositivos con potencia de cálculo insuficiente afectarán gravemente la experiencia del usuario, y eliminar las tarjetas gráficas con potencia de cálculo insuficiente podría ofrecer una mejora cualitativa al producto en su conjunto.
Inference comunidad DC en chino
Enrutamiento de trabajo ponderado por derechos
La ruta de trabajo ponderada por derechos calcula la prioridad de los puntos obtenidos por los mineros, añadiendo el parámetro k en la fórmula de puntuación por cada unidad de trabajo.
Puntuación de prioridad = 1 + k * (Memoria de la tarjeta del minero / Memoria total de la red * Cantidad de INT en staking en la red * Peso de reputación del minero)
k = 0: El enrutador utiliza un método cíclico para proporcionar puntos equivalentes a todos los mineros.
Cuando la tasa de utilización de la red es baja: se aumentará el valor de k, lo que incrementará las recompensas para los mineros.
En momentos de alta utilización de la red: se reducirá el valor de k, lo que hará que las recompensas obtenidas por mineros de diversos tamaños tiendan a equilibrarse.
A través de la modificación dinámica del parámetro k, se logra el incentivo más razonable y la mejor tasa de utilización de recursos bajo diferentes condiciones de la red. Esto significa que, para los mineros, durante períodos de baja demanda, aún hay buenas recompensas en puntos. Y en épocas de alta demanda, incluso los mineros con muy pocos derechos pueden contribuir y recibir recompensas.
sistema de doble token
Epoch3 lanza un sistema de doble token, puntos INT y token INT-DEV. Actualmente, los tokens de prueba y los puntos no tienen valor, solo se utilizan para pruebas.
INT puntos se utilizan principalmente para calcular la carga de trabajo de los mineros, y también son un indicador importante de la participación en la red en esta etapa actual.
El token INT-DEV es un token de la red de pruebas Solana Devnet, que no tiene valor. Se utiliza principalmente para pruebas de distribución de airdrops y recompensas, y su función actual es probar el sistema de staking.
Sistema de staking
El sistema de staking utiliza el estándar de tokens SPL del token INT-DEV. Este sistema es similar a un acelerador, que permite a cualquier minero crear un grupo de staking de INT, establecer la tasa de comisión y atraer a otros poseedores de INT para que participen en el staking.
Como creador del pool de staking, cuanto más stakee la gente y más INT haya, más tareas de inferencia podrá recibir de la red. El propietario del pool establecerá una tasa de comisión al crear el pool. Después de completar cada tarea de inferencia, se otorgarán puntos al pool de staking. Una vez que el propietario retire su parte, los puntos restantes se distribuirán entre los usuarios que hayan hecho staking en el pool.
Como usuario que solo tiene tokens INT y no tiene máquinas de minería, puede apostar su INT en un grupo de minería con alta distribución de beneficios para obtener mayores rendimientos. El objetivo es un grupo con alta potencia de cálculo de la máquina y pocos apostadores.
El fondo de staking del autor, todos son bienvenidos a participar en el staking. Actualmente, no hay ganancias por el staking, es solo para pruebas.
Aquí se vislumbra la influencia de Multicoin Capital, lo que también confirma su participación en la inversión. El mecanismo de staking de Inference busca ampliar la base de inversores de manera similar a io.net. Esto se considera una ventaja para proyectos de progreso lento, ya que los modelos que surgen de los proyectos líderes en la misma pista pueden ser mejorados y aplicados. Sin embargo, esto no significa que la introducción del mecanismo de staking pueda tener un impacto positivo en el precio del token; el rendimiento de IO es un claro ejemplo de ello.
Sistema de reputación (lanzado en la fase posterior de Epoch 3)
El sistema de reputación asigna valores de crédito según el rendimiento de los mineros, evaluando la capacidad de razonamiento y la estabilidad de la operación. Creo que este mecanismo puede promover la descentralización del proyecto, lo cual es mucho más fuerte que muchos proyectos que solo venden nodos o permiten participar en el razonamiento simplemente por dinero; de hecho, es un proyecto que está haciendo cosas reales.
Revisión de la Época 2
La Época 2 comenzó en noviembre del año pasado, y el rendimiento inicial de la Época 2 fue relativamente pobre, en primer lugar, la cantidad de inferencia en toda la red en los primeros tres meses fue pequeña, solo entre el 10 y el 20% de la cantidad habitual. Al respecto, el funcionario ya había respondido en DC antes del inicio de la segunda fase, "la respuesta sencilla en este momento es que 'los puntos se convertirán de manera razonable, teniendo en cuenta su valor relativo al resto de la red cuando se ganen', lo que asegura que los primeros sean debidamente recompensados, pero también tiene en cuenta que hay que seguir incentivando a los operadores para que aporten sus cálculos". Es decir, de acuerdo con el funcionamiento real de la red, los incentivos se distribuirán de manera relativamente justa para los participantes.
El autor hace una inferencia razonable sobre el mal desempeño de la segunda fase:
En ese momento, la oficial prometió eliminar las tarjetas gráficas inferiores a RTX3090, pero en realidad no lo hizo, lo que hizo que muchas tareas se asignaran a tarjetas gráficas con potencia de cálculo insuficiente como la RTX3060, lo que podría causar algunos problemas. Por ejemplo, en situaciones de carga de trabajo limitada, la tarea fue obtenida por la RTX3060, pero la RTX3060 tiene una velocidad de inferencia lenta, lo que finalmente hizo que las tarjetas de alta potencia como la RTX3090 y RTX4090 no recibieran tareas, lo que naturalmente resultó en una falta de volumen de inferencia. Esto llevó a una disminución en la puntuación.
Por otro lado, el equipo de Inference (anteriormente Kuzco) participó en diciembre pasado como un socio importante en el hackathon de IA de Solana, justo en el momento en que la red tuvo problemas. Se puede suponer razonablemente que Sam y el equipo de Inference se centraron en el hackathon y no mantuvieron bien la plataforma.
Esta situación persistió hasta mediados de febrero, cuando la red comenzó a volver a la normalidad. Sin embargo, después de que la red se normalizó, la cantidad de tarjetas gráficas que participaban en la minería era muy inferior a la de Epoch1. Además, la cantidad de tareas que cada tarjeta gráfica obtenía era también mucho menor en comparación con Epoch1, debido a que en Epoch2 la compañía limitó el uso de múltiples instancias. Según las regulaciones del sitio oficial, una GPU solo puede ejecutar un trabajador. Sin embargo, en la práctica, es posible ejecutar múltiples instancias en una sola tarjeta. El autor ya había publicado el script para múltiples instancias en GitHub.
Recomendación de configuración
La siguiente es una combinación de configuración que ofrece una buena relación calidad-precio, comprobada por el autor: X99 + E5 + RTX3090. Anteriormente, debido a la guerra comercial, el precio de la tarjeta gráfica 3090 subió de un promedio de 5700 yuanes a 6700 yuanes. Ahora la situación ha mejorado, el mercado se ha enfriado y el precio de las tarjetas gráficas ha vuelto a los niveles anteriores a los aranceles, lo que representa una oportunidad para adquirirlas. Además, si los lectores desean participar en la inversión en componentes de minería, primero enfrentarán una pérdida del 20-30%, ya que este es el gasto de depreciación del equipo, sin contar el costo de la electricidad. Si desean elegir un proveedor de potencia en la nube o un intermediario, deben asegurarse de que la otra parte tenga la capacidad para enfrentar la inestabilidad de los proyectos en etapa inicial.
Por último, un recordatorio: Inference es un proyecto de minería de IA en sus inicios y actualmente, por razones desconocidas, no ha publicado su financiación. La estabilidad de la red no es suficiente, a menudo hay caídas de la red y las actualizaciones frecuentes sin previo aviso provocan desconexiones de los mineros, entre otros. Otro riesgo es que los ingresos son desconocidos; actualmente solo se pueden obtener puntos. Si vale la pena invertir tiempo y recursos en este proyecto, por favor, cada uno considere por sí mismo.
Placa base: plataforma de inserción directa de múltiples tarjetas U dual X99
CPU: E5 2680V
Memoria: 32GB+ (el arranque simultáneo de múltiples tarjetas ocupará una gran cantidad de memoria por un corto período de tiempo)
La fuente de alimentación se determina según el consumo, como en una configuración de 6 tarjetas 3090 con doble fuente de alimentación (se necesita configurar un cable de arranque en paralelo para la fuente).
Disco duro: 500GB+ (un proceso necesita descargar un modelo de IA por separado, lo que requiere cierto espacio en el disco duro)
Red: más de un gigabit (la red tiene un gran impacto en el trabajo, debe tener una buena configuración)
Plataforma de 6 tarjetas 3090, consumo total de la máquina de 3-4kw, consumo real de 1-2kw. (Principalmente depende de la situación de funcionamiento de la red, no está en funcionamiento a plena carga 7*24 horas.)
Presupuesto: Placa base ¥700, CPU ¥200, Fuente de alimentación ¥600, 6*3090 ¥36,000, Caja y otras configuraciones ¥600. Un conjunto cuesta aproximadamente ¥38,000. La potencia de cálculo al ejecutar el modelo meta llama 8b es de aproximadamente 600 Toks/s, con un volumen teórico de inferencia diario por máquina de 50M, medida real entre 10-20M. Estos datos son solo de referencia.
El contenido es solo de referencia, no una solicitud u oferta. No se proporciona asesoramiento fiscal, legal ni de inversión. Consulte el Descargo de responsabilidad para obtener más información sobre los riesgos.
Guía práctica de a16z "Discípulo" Inference Parte 3: Inicio de pruebas de incentivo de Epoch3, Multicoin Capital entra con gran inversión
Escrito por: J1N, Techub News
Epoch3 se lanzó oficialmente el 7 de junio de 2025, introduciendo cambios importantes en el protocolo, incluidos mejoras tecnológicas, un nuevo mecanismo de staking y cambios operativos.
Kuzco ha realizado una actualización de marca, ahora se llama Inference.
La inversión de Multicoin Capital en este proyecto es cierta.
Se han elevado los umbrales de los dispositivos
Lanzar un mecanismo de minería de staking similar al de io.net
Revisión de Epoch2
Recomendación de configuración para participar
Se recomienda revisar los artículos anteriores antes de leer:
Guía práctica de a16z "Discípulo" Kuzco: ¿Cómo realizar la minería de potencia de AI de manera eficiente?
Guía práctica de a16z "Discípulo" Kuzco II: De la guerra individual al despliegue colectivo
Multicoin Capital entra en acción
En diciembre del año pasado, Sam, el fundador de Inference, afirmó en el canal de mineros de oro de DC oficial que el proyecto había recibido una financiación de 11.5 millones de dólares de Multicoin Capital y a16z csx. Esta noticia fue confirmada recientemente, y el proyecto se puede ver en la lista de cartera de Multicoin Capital. Es cierto que Inference recibió inversión de Multicoin Capital. (Multicoin Capital también fue un inversor temprano en io.net)
Epoch 3 inicial
Desde el lanzamiento de Epoch3 el 7 de junio de 2025, la red ha estado en funcionamiento durante 10 días. En comparación con las dos fases anteriores, el número de mineros participantes ha aumentado notablemente, así como el volumen de inferencias y la estabilidad de la red. Hasta el momento de escribir, el número de trabajadores ha alcanzado 12,100; aunque en términos numéricos aún no ha superado el valor máximo de 14,000 de Epoch1. Sin embargo, Epoch3 ha limitado las tarjetas gráficas de bajo rendimiento y las instancias múltiples, por lo que se puede inferir razonablemente que el número de participantes es varias veces mayor que en las primeras etapas.
¿Qué cambios trae la Época 3?
Actualización automática de nodos
La función de actualización automática de nodos puede reducir significativamente la carga operativa de los mineros. Después de experimentar con Epoch 1&2, la oficial actualiza los archivos de manera irregular y las notificaciones de actualización no son oportunas. Esto provoca que muchos usuarios terminen sus procesos, pensando que hay un problema con el dispositivo, y pasan mucho tiempo tratando de resolverlo, cuando en realidad la razón es que los usuarios no han actualizado a tiempo.
Gestión del motor de inferencia unificado
El autor ha ejecutado el modelo Llama-3.1-8B de Meta en ambas ocasiones y no ha encontrado los modelos que se indican en la documentación oficial como seleccionables. Esto es cuestionable. Además, si es posible elegir, es preferible optar por modelos con mayor tasa de uso, ya que generan una mayor cantidad de inferencias y se obtienen puntuaciones más altas.
Detección y verificación mejoradas de GPU
Inference anunció que iba a eliminar de forma obligatoria las tarjetas gráficas con potencia de cálculo inferior a RTX 3080 desde la Época 2, probablemente por temor a la insatisfacción de la comunidad, por lo que no se ha ejecutado hasta el final de la Época 2. Aún se puede ver que hay una gran cantidad de tarjetas gráficas con potencia de cálculo insuficiente, como 3060, 3070, participando en la inferencia. El autor considera que los dispositivos con potencia de cálculo insuficiente afectarán gravemente la experiencia del usuario, y eliminar las tarjetas gráficas con potencia de cálculo insuficiente podría ofrecer una mejora cualitativa al producto en su conjunto.
Inference comunidad DC en chino
Enrutamiento de trabajo ponderado por derechos
La ruta de trabajo ponderada por derechos calcula la prioridad de los puntos obtenidos por los mineros, añadiendo el parámetro k en la fórmula de puntuación por cada unidad de trabajo.
Puntuación de prioridad = 1 + k * (Memoria de la tarjeta del minero / Memoria total de la red * Cantidad de INT en staking en la red * Peso de reputación del minero)
k = 0: El enrutador utiliza un método cíclico para proporcionar puntos equivalentes a todos los mineros.
Cuando la tasa de utilización de la red es baja: se aumentará el valor de k, lo que incrementará las recompensas para los mineros.
En momentos de alta utilización de la red: se reducirá el valor de k, lo que hará que las recompensas obtenidas por mineros de diversos tamaños tiendan a equilibrarse.
A través de la modificación dinámica del parámetro k, se logra el incentivo más razonable y la mejor tasa de utilización de recursos bajo diferentes condiciones de la red. Esto significa que, para los mineros, durante períodos de baja demanda, aún hay buenas recompensas en puntos. Y en épocas de alta demanda, incluso los mineros con muy pocos derechos pueden contribuir y recibir recompensas.
sistema de doble token
Epoch3 lanza un sistema de doble token, puntos INT y token INT-DEV. Actualmente, los tokens de prueba y los puntos no tienen valor, solo se utilizan para pruebas.
INT puntos se utilizan principalmente para calcular la carga de trabajo de los mineros, y también son un indicador importante de la participación en la red en esta etapa actual.
El token INT-DEV es un token de la red de pruebas Solana Devnet, que no tiene valor. Se utiliza principalmente para pruebas de distribución de airdrops y recompensas, y su función actual es probar el sistema de staking.
Sistema de staking
El sistema de staking utiliza el estándar de tokens SPL del token INT-DEV. Este sistema es similar a un acelerador, que permite a cualquier minero crear un grupo de staking de INT, establecer la tasa de comisión y atraer a otros poseedores de INT para que participen en el staking.
Como creador del pool de staking, cuanto más stakee la gente y más INT haya, más tareas de inferencia podrá recibir de la red. El propietario del pool establecerá una tasa de comisión al crear el pool. Después de completar cada tarea de inferencia, se otorgarán puntos al pool de staking. Una vez que el propietario retire su parte, los puntos restantes se distribuirán entre los usuarios que hayan hecho staking en el pool.
Como usuario que solo tiene tokens INT y no tiene máquinas de minería, puede apostar su INT en un grupo de minería con alta distribución de beneficios para obtener mayores rendimientos. El objetivo es un grupo con alta potencia de cálculo de la máquina y pocos apostadores.
El fondo de staking del autor, todos son bienvenidos a participar en el staking. Actualmente, no hay ganancias por el staking, es solo para pruebas.
Aquí se vislumbra la influencia de Multicoin Capital, lo que también confirma su participación en la inversión. El mecanismo de staking de Inference busca ampliar la base de inversores de manera similar a io.net. Esto se considera una ventaja para proyectos de progreso lento, ya que los modelos que surgen de los proyectos líderes en la misma pista pueden ser mejorados y aplicados. Sin embargo, esto no significa que la introducción del mecanismo de staking pueda tener un impacto positivo en el precio del token; el rendimiento de IO es un claro ejemplo de ello.
Sistema de reputación (lanzado en la fase posterior de Epoch 3)
El sistema de reputación asigna valores de crédito según el rendimiento de los mineros, evaluando la capacidad de razonamiento y la estabilidad de la operación. Creo que este mecanismo puede promover la descentralización del proyecto, lo cual es mucho más fuerte que muchos proyectos que solo venden nodos o permiten participar en el razonamiento simplemente por dinero; de hecho, es un proyecto que está haciendo cosas reales.
Revisión de la Época 2
La Época 2 comenzó en noviembre del año pasado, y el rendimiento inicial de la Época 2 fue relativamente pobre, en primer lugar, la cantidad de inferencia en toda la red en los primeros tres meses fue pequeña, solo entre el 10 y el 20% de la cantidad habitual. Al respecto, el funcionario ya había respondido en DC antes del inicio de la segunda fase, "la respuesta sencilla en este momento es que 'los puntos se convertirán de manera razonable, teniendo en cuenta su valor relativo al resto de la red cuando se ganen', lo que asegura que los primeros sean debidamente recompensados, pero también tiene en cuenta que hay que seguir incentivando a los operadores para que aporten sus cálculos". Es decir, de acuerdo con el funcionamiento real de la red, los incentivos se distribuirán de manera relativamente justa para los participantes.
El autor hace una inferencia razonable sobre el mal desempeño de la segunda fase:
En ese momento, la oficial prometió eliminar las tarjetas gráficas inferiores a RTX3090, pero en realidad no lo hizo, lo que hizo que muchas tareas se asignaran a tarjetas gráficas con potencia de cálculo insuficiente como la RTX3060, lo que podría causar algunos problemas. Por ejemplo, en situaciones de carga de trabajo limitada, la tarea fue obtenida por la RTX3060, pero la RTX3060 tiene una velocidad de inferencia lenta, lo que finalmente hizo que las tarjetas de alta potencia como la RTX3090 y RTX4090 no recibieran tareas, lo que naturalmente resultó en una falta de volumen de inferencia. Esto llevó a una disminución en la puntuación.
Por otro lado, el equipo de Inference (anteriormente Kuzco) participó en diciembre pasado como un socio importante en el hackathon de IA de Solana, justo en el momento en que la red tuvo problemas. Se puede suponer razonablemente que Sam y el equipo de Inference se centraron en el hackathon y no mantuvieron bien la plataforma.
Esta situación persistió hasta mediados de febrero, cuando la red comenzó a volver a la normalidad. Sin embargo, después de que la red se normalizó, la cantidad de tarjetas gráficas que participaban en la minería era muy inferior a la de Epoch1. Además, la cantidad de tareas que cada tarjeta gráfica obtenía era también mucho menor en comparación con Epoch1, debido a que en Epoch2 la compañía limitó el uso de múltiples instancias. Según las regulaciones del sitio oficial, una GPU solo puede ejecutar un trabajador. Sin embargo, en la práctica, es posible ejecutar múltiples instancias en una sola tarjeta. El autor ya había publicado el script para múltiples instancias en GitHub.
Recomendación de configuración
La siguiente es una combinación de configuración que ofrece una buena relación calidad-precio, comprobada por el autor: X99 + E5 + RTX3090. Anteriormente, debido a la guerra comercial, el precio de la tarjeta gráfica 3090 subió de un promedio de 5700 yuanes a 6700 yuanes. Ahora la situación ha mejorado, el mercado se ha enfriado y el precio de las tarjetas gráficas ha vuelto a los niveles anteriores a los aranceles, lo que representa una oportunidad para adquirirlas. Además, si los lectores desean participar en la inversión en componentes de minería, primero enfrentarán una pérdida del 20-30%, ya que este es el gasto de depreciación del equipo, sin contar el costo de la electricidad. Si desean elegir un proveedor de potencia en la nube o un intermediario, deben asegurarse de que la otra parte tenga la capacidad para enfrentar la inestabilidad de los proyectos en etapa inicial.
Por último, un recordatorio: Inference es un proyecto de minería de IA en sus inicios y actualmente, por razones desconocidas, no ha publicado su financiación. La estabilidad de la red no es suficiente, a menudo hay caídas de la red y las actualizaciones frecuentes sin previo aviso provocan desconexiones de los mineros, entre otros. Otro riesgo es que los ingresos son desconocidos; actualmente solo se pueden obtener puntos. Si vale la pena invertir tiempo y recursos en este proyecto, por favor, cada uno considere por sí mismo.
Placa base: plataforma de inserción directa de múltiples tarjetas U dual X99
CPU: E5 2680V
Memoria: 32GB+ (el arranque simultáneo de múltiples tarjetas ocupará una gran cantidad de memoria por un corto período de tiempo)
La fuente de alimentación se determina según el consumo, como en una configuración de 6 tarjetas 3090 con doble fuente de alimentación (se necesita configurar un cable de arranque en paralelo para la fuente).
Disco duro: 500GB+ (un proceso necesita descargar un modelo de IA por separado, lo que requiere cierto espacio en el disco duro)
Red: más de un gigabit (la red tiene un gran impacto en el trabajo, debe tener una buena configuración)
Plataforma de 6 tarjetas 3090, consumo total de la máquina de 3-4kw, consumo real de 1-2kw. (Principalmente depende de la situación de funcionamiento de la red, no está en funcionamiento a plena carga 7*24 horas.)
Presupuesto: Placa base ¥700, CPU ¥200, Fuente de alimentación ¥600, 6*3090 ¥36,000, Caja y otras configuraciones ¥600. Un conjunto cuesta aproximadamente ¥38,000. La potencia de cálculo al ejecutar el modelo meta llama 8b es de aproximadamente 600 Toks/s, con un volumen teórico de inferencia diario por máquina de 50M, medida real entre 10-20M. Estos datos son solo de referencia.