Sobre multiplexação na geração de números aleatórios físicos e conteúdo de entropia total conservado
Scientific Reports volume 13, Número do artigo: 7892 (2023) Citar este artigo
227 Acessos
Detalhes das métricas
No artigo atual, usamos um supercontínuo aleatório baseado em um laser de realimentação distribuído Raman aleatório para investigar a geração de números aleatórios demultiplexando espectralmente o amplo espectro do supercontínuo em canais paralelos. Ao ajustar a separação espectral entre dois canais independentes, testamos as habilidades dos testes estatísticos mais usados para identificar a separação espectral mínima necessária entre os canais, especialmente após o uso de etapas de pós-processamento. De todos os testes investigados, a correlação cruzada entre canais usando os dados brutos parece ser a mais robusta. Também demonstramos que o uso de etapas de pós-processamento, seja extração de bits menos significativos ou operações de OU-exclusivo, dificulta a capacidade desses testes de detectar as correlações existentes. Assim, a realização desses testes em dados pós-processados, frequentemente relatados na literatura, é insuficiente para estabelecer adequadamente a independência de dois canais paralelos. Portanto, apresentamos uma metodologia que pode ser usada para confirmar a verdadeira aleatoriedade de esquemas paralelos de geração de números aleatórios. Por fim, demonstramos que, embora o ajuste da largura de banda de um único canal possa modificar sua saída potencial de aleatoriedade, também afeta o número de canais disponíveis, de modo que a taxa de bits total da geração de números aleatórios seja conservada.
A geração de números aleatórios (RNG) é cada vez mais solicitada por inúmeras aplicações, como simulações de Monte Carlo1, algoritmos de aprendizado de máquina2 e comunicações seguras3. Enquanto geradores de números pseudoaleatórios baseados em cálculos algorítmicos costumavam ser suficientes para esse propósito, certas aplicações que exigem uma quantidade muito grande de números aleatórios começam a revelar suas limitações. Como tal, números aleatórios verdadeiros gerados por processos físicos, em oposição a algoritmos determinísticos, aumentaram muito o interesse nos últimos anos. De fato, uma vez que são baseados em sistemas aleatórios físicos verdadeiros, eles não sofrem dos mesmos problemas de reprodutibilidade e periodicidade que até mesmo os melhores sistemas pseudo-RNG exibem. No entanto, para garantir que os números gerados sejam realmente aleatórios, é importante identificar adequadamente a origem da aleatoriedade e quantificar seu potencial. O RNG baseado em processos quânticos oferece certeza absoluta sobre a verdadeira aleatoriedade do sistema, pois a aleatoriedade se origina de probabilidades quânticas inerentes. No entanto, as taxas de bits que podem ser alcançadas por esses sistemas são relativamente baixas, normalmente em velocidades de Mbps a Gbps4. Isso é insuficiente para os aplicativos descritos anteriormente, que consomem bits aleatórios em velocidades incrivelmente altas. Portanto, novas fontes de aleatoriedade foram investigadas para gerar bits aleatórios a taxas mais altas do que atualmente alcançáveis com processos quânticos.
O estado atual da arte depende da entropia gerada por lasers semicondutores operando caoticamente devido ao feedback externo à cavidade. Devido às grandes larguras de banda de lasers caóticos, taxas RNG de centenas de Gbps foram demonstradas5, e trabalhos recentes demonstraram como esses bits gerados aleatoriamente podem ser extraídos usando quantização totalmente óptica, o que permite superar as larguras de banda limitadas de componentes eletrônicos como fotodiodos e conversores analógico-digital6. No entanto, a origem da aleatoriedade nesses sistemas caóticos não é tão óbvia quanto no caso dos sistemas quânticos e, na corrida para atingir a maior taxa de RNG possível, muitos atalhos foram tomados. Um dos mais prevalentes na literatura é o uso de etapas complexas de pós-processamento para ocultar correlações existentes em sequências de bits que não são suficientemente aleatórias para passar em testes estatísticos7,8,9,10,11. Uma etapa comum de pós-processamento depende da aplicação de uma operação de OU exclusivo (XOR) entre o fluxo de bits original e uma versão com atraso de tempo dele7,8,9. Operações de pós-processamento ainda mais complexas, como o uso de derivadas numéricas sucessivas, oferecem a promessa de gerar mais bits aleatórios por medição do que a digitalização original usada, o que novamente deve levantar algumas preocupações sobre a verdadeira aleatoriedade das sequências de bits assim geradas10, 11. Em 2017, Hart et al. emitiu algumas recomendações para a avaliação do conteúdo de entropia de sistemas RNG físicos12. Em seu artigo, eles recomendam que os pesquisadores confiem apenas em dados minimamente pós-processados com o objetivo de gerar RNG verdadeiro, e que qualquer sequência de bits que requeira o uso de pós-processamento complexo para passar em testes estatísticos seja vista como nada mais do que uma sequência de bits pseudo-aleatória de alta qualidade. Além disso, eles argumentam que a origem física da entropia deve ser investigada e calculada teoricamente, em vez de depender apenas de testes estatísticos.